可以假设固定分数或随机分数来定义 r平方:
固定分数:样本量和预测变量的特定值保持固定。因此,是当预测变量值保持恒定时在总体回归方程中由结果解释的方差比例。
随机分数:预测变量的特定值是从分布中得出的。因此,指的是总体中结果中解释的方差比例,其中预测变量值对应于预测变量的总体分布。
之前我曾问过这种区别是否对估计有很大的不同。我也普遍询问过如何计算的无偏估计 。
我看到随着样本数量的增加,固定得分和随机得分之间的区别变得不那么重要了。但是,我试图确认调整后的是用于估计固定分数还是随机分数。
问题
- 调整后的 旨在估计固定分数或随机分数?
- 是否存在关于调整后的r平方的公式与一种或其他形式之间的关系的原则性解释?
我困惑的背景
当我读殷和范(2001,p.206)时,他们写道:
多元回归模型的基本假设之一是自变量的值是已知常数,并且在实验之前由研究人员确定。只有因变量可以随样本的不同而自由变化。该回归模型称为固定线性回归模型。
但是,在社会科学和行为科学中,研究人员很少固定自变量的值,而且自变量也容易出现随机误差。因此,已经提出了第二种应用回归模型,在该模型中,因变量和自变量都可以变化(Binder,1959; Park&Dudycha,1974)。该模型称为随机模型(或校正模型)。尽管在正态性假设下从随机模型和固定模型获得的回归系数的最大似然估计是相同的,但它们的分布却非常不同。随机模型是如此复杂,以至于需要接受更多的研究才能代替通常使用的固定线性回归模型。因此,通常采用固定模型,即使没有完全满足这些假设(Claudy,1978年)。假设违背固定回归模型的这种应用将导致“过度拟合”,因为从效果不佳的样本数据中引入的随机误差往往会在过程中被大写。结果,以这种方式获得的样本多重相关系数往往会高估真实的人口多重相关(Claudy,1978; Cohen&Cohen,1983; Cummings,1982)。
因此,我不清楚上面的说法是说调整后的补偿了随机模型引入的误差,还是只是在标记该随机模型存在的文件中作了警告,但该论文将专注于固定模型。
参考文献
- Yin,P.,&Fan,X.(2001年)。在多元回归中估计收缩:不同分析方法的比较。实验教育杂志,69(2),203-224。PDF格式