简单线性回归的报告结果:要包括哪些信息?


11

我刚刚在Genstat中执行了一些(非常简单的)线性回归,并希望在报告中包含输出的简要且有意义的摘要。我不确定我应该包括哪些信息或多少信息。

Genstat输出的主要部分如下所示:

Summary of analysis 
Source      d.f.    s.s.       m.s.       v.r.    F pr.
Regression    1   8128935.   8128935.    814.41   <.001
Residual     53    529015.      9981.        
Total        54   8657950.    160332.        

Percentage variance accounted for 93.8
Standard error of observations is estimated to be 99.9.

Estimates of parameters 
Parameter    estimate    s.e.     t(53)   t pr.
Constant      41.5      30.7       1.35   0.182
UKHR_Ref       0.8659    0.0303   28.54   <.001

我打算将其简单地报告为:

Adjusted R2 = 0.94 (slope = 0.87, p < 0.001; intercept not significantly different from 0).

但是一位同事建议我也至少应包括root mean squared error(我认为在这种情况下等于观察值的标准误差,即99.9?)。

包括RMSE是否提供了更多有用的信息,或者调整后的R2值是否已经充分说明了拟合优度?

是否有关于要报告多少信息的严格规则,还是相当主观的?

非常感谢!


1
“是否有严格的规则来报告多少信息”-这实际上取决于您在回归后想要做什么。人们可能只对相关系数感到满意;一个人可能最需要Durbin-Watson值,而另一个人可能希望看到帽子矩阵的对角线……这确实取决于。
JM不是统计学家

2
一些组织确实有规则。例如,请参阅APA指​​南
Whuber

Answers:


6

对于简单的线性回归,我将始终生成x变量相对于y变量的图,并且将回归线叠加在该图上(只要可行,总是绘制数据!)。这将非常容易地告诉您模型的拟合程度,并且对于1个变量回归很容易阅读。尽管您可能希望包括一些诊断图(杠杆,烹饪距离,残差等),但将其添加到已经拥有的内容中可能就足够了。这取决于xy图的好坏,目标受众以及受众期望的协议。

R2

R2±±2R2


谢谢@probabilityislogic。我在报告中包括了一个情节,在这种情况下,听起来像加上我的原始句子就足够了。我认为,对于该受众来说,包括诊断图可能是不必要的,尽管我显然已经对它们进行了检查并且看起来很合理。也感谢R2对RMSE的解释-这非常有帮助。
JamesS 2011年

t值和df呢?什么时候应该包括这些?仅包括两者不包括两者都有意义吗?
关于natty的坚果,2013年

1

我用来报告β系数加上95%CI,p值和调整后的Rsquared。例如:

(β= 1.46,95%CI [1.19,1.8],p = 0.001 **,调整后的R2 = 0.48)

如果报告多元回归或具有因子变量的回归,则报告系数,95%CI,p值,然后分别报告F(自由度)统计量,模型的调整后R2和p值。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.