Answers:
皮尔逊相关系数用于衡量线性关联。基于经验的第二中心矩,它受极限值的影响。因此:
实际vs预测值散点图中的非线性证据表明,建议使用诸如秩相关(Spearman)系数之类的替代方法。
如果该关系平均看起来是单调的(如图中上排所示),则秩相关系数将是有效的;
否则,该关系是曲线的(例如在插图的下排的某些示例中,例如最左侧或中间的U形),并且任何相关性度量都可能是不够充分的描述;使用等级相关系数无法解决此问题。
散点图中异常数据的存在表明Pearson相关系数可能高估了线性关系的强度。它可能正确或不正确;谨慎使用。等级相关系数可能会更好,也可能不会更好,这取决于离群值的可信度。
(图片摘自Wikipedia关于Pearson积矩相关系数的文章。)