MSEloss

均方误差
Pasted image 20250509005105.png
平方惩罚,因此大误差被放大,对离群点敏感度更高进而更倾向被离群点拉动。

平滑可导,因此梯度下降更容易收敛

统计上对应预测误差的均值估计(最小化平方偏差)
Pasted image 20250509005623.png

何时选择MSE

当大误差比小误差更不可接受时,需要对大误差进行更强的惩罚
在训练时倾向于使用梯度下降,MSE的平方项保证了损失函数的平滑可导

MSE用平方度量误差,对大误差更加敏感并且优化过程光滑,具体任务对“均衡性”或者“惩罚大误差”有需求时可以选择