我想到了以下提出的调整后的R平方公式:
以西结(1930),我相信这是目前SPSS中使用的一种。
奥尔金和普拉特(1958)
在什么情况下(如果有)我应该更喜欢“调整”而不是“无偏”?
参考文献
- Ezekiel,M.(1930年)。相关分析方法。纽约约翰·威利父子。
- 奥尔金(Olkin I.),普拉特(Pratt)JW(1958)。某些相关系数的无偏估计。数理统计年鉴,29(1),201-211。
我想到了以下提出的调整后的R平方公式:
以西结(1930),我相信这是目前SPSS中使用的一种。
奥尔金和普拉特(1958)
在什么情况下(如果有)我应该更喜欢“调整”而不是“无偏”?
参考文献
Answers:
不想在@ttnphns的回答中功不可没,我想将答案移出评论(特别是考虑到与该文章的链接已消失)。马特·克劳斯(Matt Krause)的答案对和R 2 a d j之间的区别进行了有益的讨论,但没有讨论在任何给定情况下使用哪个R 2 a d j公式的决定。
正如我在讨论这个答案,阴和范(2001)提供了许多不同的化学式的很好的概述用于估计总体方差解释,所有这些都可能被标记的一种类型的调整- [R 2。
它们执行模拟,以评估其一个宽范围中调节的R平方式的提供不同样本大小最好无偏估计,,和预测器交互相关。他们认为,普拉特公式可能是一个不错的选择,但我认为该研究在此问题上不是确定的。
更新: Raju等人(1997)指出,调整公式有所不同基于它们是否被设计为估计调整- [R 2假设固定x或随机-X predcitors。具体而言,式Ezekial被设计来估计ρ 2在固定-X范围内,和Olkin型-Pratt和普拉特公式被设计来估计ρ 2在随机-X上下文。Olkin-Pratt和Pratt公式之间没有太大区别。当您假设预测变量的值是可能值的样本时(如观察研究中的典型情况),固定x假设与计划的实验一致,随机x假设与之一致。看到这个答案有待进一步讨论。随着样本量逐渐变大,两种类型的公式之间也没有太大差异(请参见此处,了解差异的大小)。
的选择或调整[R 2取决于你想做什么。在回归上下文中,常规R 2用作模型拟合优度的度量。但是,假设您正在比较具有不同参数数量的几个模型。在所有条件相同的情况下,具有更多参数的模型将更适合您的观察。在极限情况下,您可以有一个模型,其中每个数据点都有参数,但每个参数都有一个参数。这将使您非常适合观察,但是对于新的预测将毫无用处,因为它可以捕获潜在的“信号”以及任何相关的噪声。调整后的R 2是通过调整R来解决此问题的尝试。根据模型中的参数数量获得 2个值。
因此,它们的用途略有不同。描述了不同数据集拟合模型的程度。您可能会写类似“上述模型在标准测试条件下准确预测部件A(r 2 = 0.9)而不是部件B(r 2 = 0.05)的性能”的内容。调整后的R 2描述了不同模型拟合相同数据(或相似数据)的程度。例如,“短期和长期问卷的结果均能很好地预测客户的年度支出(两者的调整后R 2 = 0.8)”。