FixMatch半监督学习方法-EW帮帮网

FixMatch半监督学习方法

FixMatch 是一种半监督学习方法，通过结合伪标签生成和一致性正则化，充分利用未标记数据，减少对标记数据的依赖，同时提升模型性能。以下是对 FixMatch 的全面介绍。

FixMatch 的核心思想：

FixMatch 的优势：

FixMatch 的训练过程可以分为以下阶段：

使用有标签样本进行监督训练，优化标准的交叉熵损失：
$\mathcal{L}_{\text{supervised}} = - \frac{1}{N_l} \sum_{i=1}^{N_l} \log p(y_i | x_i)$

对未标记样本 $x_u$ 应用 强增强，生成增强后的样本 $T_{\text{strong}}(x_u)$ 。
使用模型对 $T_{\text{strong}}(x_u)$ 预测概率分布：
$T_{\text{strong}}(x_u))$
检查预测的最大置信度是否超过阈值 $\tau$ （如 0.95）：
$\max p(y | T_{\text{strong}}(x_u)) > \tau$
如果满足，生成伪标签：
$\hat{y}_u = \arg\max p(y | T_{\text{strong}}(x_u))$

对同一未标记样本 $x_u$ 应用 弱增强，生成 $T_{\text{weak}}(x_u)$ 。
使用伪标签 $\hat{y}_u$ 和弱增强的预测结果计算一致性损失：
$\mathcal{L}_{\text{consistency}} = \frac{1}{N_u} \sum_{i=1}^{N_u} \mathbb{I}(\max p(y | T_{\text{strong}}(x_u)) > \tau) \cdot \mathcal{L}_{\text{pseudo}}(\hat{y}_u, \hat{y}_u^{\text{weak}})$

FixMatch 的总损失是有标签损失和无标签一致性损失的加权和：
$\mathcal{L}_{\text{total}} = \mathcal{L}_{\text{supervised}} + \lambda \cdot \mathcal{L}_{\text{consistency}}$