测量训练后的神经网络的相关性


9

我正在使用非正态分布数据训练人工神经网络(反向传播,前馈)。除了均方根误差外,文献还经常提出用于评估训练网络质量的皮尔逊相关系数。但是,如果训练数据不是正态分布的,Pearson相关系数是否合理?使用基于等级的相关度量(例如Spearman rho)是否更合理?


您能否详细说明一个人将如何使用它或提供参考?
2011年

Answers:


6

皮尔逊相关系数用于衡量线性关联。基于经验的第二中心矩,它受极限值的影响。因此:

  • 实际vs预测值散点图中的非线性证据表明,建议使用诸如秩相关(Spearman)系数之类的替代方法。

    • 如果该关系平均看起来是单调的(如图中上排所示),则秩相关系数将是有效的;

    • 否则,该关系是曲线的(例如在插图的下排的某些示例中,例如最左侧或中间的U形),并且任何相关性度量都可能是不够充分的描述;使用等级相关系数无法解决此问题。

  • 散点图中异常数据的存在表明Pearson相关系数可能高估了线性关系的强度。它可能正确或不正确;谨慎使用。等级相关系数可能会更好,也可能不会更好,这取决于离群值的可信度。

散点图及其Pearson相关性的示例

(图片摘自Wikipedia关于Pearson积矩相关系数的文章。)


您能否提供一些有关使用秩相关来衡量回归性能的陈述的资料?
Simon Kuang
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.