我正在使用一些循环神经网络结构进行多标签分类。我的问题是关于损失函数:我的输出将是真/假(1/0)值的向量,以指示每个标签的类别。许多资源说汉明损失是适当的目标。然而,汉明损失在梯度计算中存在一个问题:H=平均(y_true异或y_pred),异或无法导出损失的梯度。那么还有其他损失函数用于训练多标签分类吗?我尝试过MSE和具有单个sigmoid输入的二进制交叉熵。
H=平均值(y_true*(1-y_pred)(1-y_true)*y_pred)
是海明损失的连续近似。