调整后的R平方是否试图估计固定分数或随机分数总体的R平方?


9

可以假设固定分数或随机分数来定义 r平方:ρ2

  • 固定分数:样本量和预测变量的特定值保持固定。因此,ρf2是当预测变量值保持恒定时在总体回归方程中由结果解释的方差比例。

  • 随机分数:预测变量的特定值是从分布中得出的。因此,指的是总体中结果中解释的方差比例,其中预测变量值对应于预测变量的总体分布。ρr2

之前我曾问过这种区别是否对估计有很大的不同ρ2。我也普遍询问过如何计算的无偏估计 ρ2

我看到随着样本数量的增加,固定得分和随机得分之间的区别变得不那么重要了。但是,我试图确认调整后的是用于估计固定分数还是随机分数。R2ρ2

问题

  • 调整后的 旨在估计固定分数或随机分数?R2ρ2
  • 是否存在关于调整后的r平方的公式与一种或其他形式之间的关系的原则性解释?ρ2

我困惑的背景

当我读殷和范(2001,p.206)时,他们写道:

多元回归模型的基本假设之一是自变量的值是已知常数,并且在实验之前由研究人员确定。只有因变量可以随样本的不同而自由变化。该回归模型称为固定线性回归模型

但是,在社会科学和行为科学中,研究人员很少固定自变量的值,而且自变量也容易出现随机误差。因此,已经提出了第二种应用回归模型,在该模型中,因变量和自变量都可以变化(Binder,1959; Park&Dudycha,1974)。该模型称为随机模型(或校正模型)。尽管在正态性假设下从随机模型和固定模型获得的回归系数的最大似然估计是相同的,但它们的分布却非常不同。随机模型是如此复杂,以至于需要接受更多的研究才能代替通常使用的固定线性回归模型。因此,通常采用固定模型,即使没有完全满足这些假设(Claudy,1978年)。假设违背固定回归模型的这种应用将导致“过度拟合”,因为从效果不佳的样本数据中引入的随机误差往往会在过程中被大写。结果,以这种方式获得的样本多重相关系数往往会高估真实的人口多重相关(Claudy,1978; Cohen&Cohen,1983; Cummings,1982)。

因此,我不清楚上面的说法是说调整后的补偿了随机模型引入的误差,还是只是在标记该随机模型存在的文件中作了警告,但该论文将专注于固定模型。R2

参考文献

  • Yin,P.,&Fan,X.(2001年)。在多元回归中估计收缩:不同分析方法的比较。实验教育杂志,69(2),203-224。PDF格式R2

Answers:


6

Raju等人(1997)指出

Pedhazur(1982)和Mitchell&Klimoski(1986)认为,
当Ns至少为中等大小(大约50)时,结果相对不受所选模型[fixed-x或random-x]的影响。

尽管如此,Raju等人(1997年)将一些用于估计调整后的公式分类为“固定X公式”和“随机X公式”。R2ρ2

固定X公式: 提到了几个公式,包括Ezekiel(1930)提出的公式,该公式在大多数统计软件中都是标准的:

ρ^(E)2=1N1Np1(1R2)

因此,该问题的简短答案是通常报告并内置到标准统计软件中的标准调整后的公式是fixed-x的估计值。R2ρ2

随机X公式:

奥尔金和普拉特(1958)提出了一个公式

ρ^(OP)2=1[N3Np1](1R2)F[1,1;Np+12;(1R2)]
其中F是超几何函数

Raju等人(1997年)解释了各种其他公式,例如Pratt和Herzberg的“如何近似于预期的超几何函数”。例如,普拉特的公式是

ρ^(P)2=1(N3)(1R2)Np1[1+2(1R2)Np2.3]

估算值有何不同? Leach和Hansen(2003)的报告提供了一个很好的表格,该表格显示了不同公式对心理学中不同的已发布数据集样本的影响(参见表3)。平均结是0.2864相比Olkin型和Pratt的0.2917和Pratt的0.2910。根据Raju等人关于固定和随机x公式之间的区别与小样本量最相关的最初报价,Leach和Hansen的表显示了以西结的固定x公式与Olkin和Pratt的random-x公式之间的区别如何最为突出小样本量,尤其是小于50的样本。Radj2Radj2Radj2

参考文献

  • Leach,LF和Henson,RK(2003)。调整后的R2效应在已发表的回归研究中的使用和影响。在德克萨斯州圣安东尼奥市西南教育研究协会的年度会议上。PDF格式
  • Mitchell,TW和Klimoski,RJ(1986)。交叉有效性估计的有效性估计。应用心理学杂志,71,311-317。
  • 佩哈祖尔(Pedhazur),EJ(1982)。行为研究中的多元回归(第二版)纽约:霍尔特,瑞纳哈特和温斯顿。
  • Raju,NS,Bilgic,R.,Edwards,JE,&Fleer,PF(1997)。方法学回顾:总体有效性和交叉有效性的估计,以及在预测中使用相等的权重。应用心理测量,21(4),291-305。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.