将Pearson相关系数作为机器学习中的优化目标


12

在机器学习中(针对回归问题),我经常看到均方误差(MSE)或均方绝对误差(MAE)被用作最小化(加上正则化项)的误差函数。我想知道是否存在使用相关系数更合适的情况?如果存在这种情况,则:

  1. 与MSE / MAE相比,在什么情况下相关系数是更好的指标?
  2. 在这些情况下,MSE / MAE还是可以使用的良好代理费用功能吗?
  3. 直接使相关系数最大化是可能的吗?这是一个稳定的目标函数吗?

我找不到在优化中直接将相关系数用作目标函数的情况。如果有人可以向我介绍该领域的信息,我将不胜感激。

Answers:


7

当输出噪声很大时,最大化相关性很有用。换句话说,输入和输出之间的关系非常弱。在这种情况下,最小化MSE将倾向于使输出接近零,从而使预测误差与训练输出的方差相同。

对于梯度下降方法,可以直接使用相关性作为目标函数(将其更改为最小化负相关性)。但是,我不知道如何使用SGD方法对其进行优化,因为成本函数和梯度涉及所有训练样本的输出。

最大化相关性的另一种方法是通过将输出方差约束为与训练输出方差相同来最小化MSE。但是,约束也涉及所有输出,因此(我认为)无法利用SGD优化器。

编辑:如果神经网络的顶层是线性输出层,我们可以最小化MSE,然后在线性层中调整权重和偏差以最大化相关性。可以与CCA(https://en.wikipedia.org/wiki/Canonical_analysis)类似地进行调整。


1

我们在研究中使用了Pearson的相关性,并且效果很好。在我们的情况下,它非常稳定。由于它是平移和缩放不变量度,因此仅在要预测形状而不是精确值时才有用。因此,如果您不知道目标是否在模型的求解空间中并且仅对形状感兴趣,这将很有用。相反,MSE减少了预测与目标之间的平均距离,因此它尝试尽可能地拟合数据。这可能是MSE被更广泛使用的原因,因为您通常对预测精确值感兴趣。如果最小化MSE,则相关性将增加。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.