多元线性回归中对p值的理解


12

关于多元线性回归分析的p值,Minitab网站的介绍如下所示。

每个项的p值检验零假设,即该系数等于零(无影响)。低p值(<0.05)表示您可以拒绝原假设。换句话说,具有低p值的预测变量可能是对模型有意义的补充,因为预测变量值的变化与响应变量的变化有关。

例如,我的合成MLR模型为 。输出结果如下所示。然后,可以使用该公式计算。ÿ=0.46753X1个-0.2668X2+1.6193X3+4.5424X4+14.48ÿ

            Estimate      SE        tStat       pValue  
               ________    ______    _________    _________

(Intercept)      14.48     5.0127       2.8886    0.0097836
x1             0.46753     1.2824      0.36458      0.71967
x2             -0.2668     3.3352    -0.079995      0.93712
x3              1.6193     9.0581      0.17877      0.86011
x4              4.5424     2.8565       1.5902       0.1292

根据上面的介绍,零假设是系数等于0。我的理解是,系数(例如的系数)将设置为0,而另一个y将被计算为。然后对和进行配对t检验,但是该t检验的p值为6.9e-12,不等于0.1292(系数的p值。X4ÿ2=0.46753X1个-0.2668X2+1.6193X3+0X4+14.48ÿÿ2X4

任何人都可以帮助您正确理解吗?非常感谢!


您可以显示回归例程的输出吗?
Aksakal 2014年

您对p值计算的描述是非标准的。您为什么认为应该按照描述的方式进行计算?根据参数的Var-Cov矩阵计算输出中的p值。如果您要像Wald这样运行限制测试,那不是您描述的方式。您必须使用3个变量重新估算模型,获得对数似然等。–
Aksakal

1
根据该介绍,您只有一个“有效”变量(即“拦截”),因为只有其p值很小。要超越报价中的幼稚和误导性做法,您需要了解有关多元回归的更多信息。要了解在这方面可以学到什么,请考虑浏览我们网站上的相关主题
ub

2
检查以下两个问题的答案:-stats.stackexchange.com/questions/5135/…-stats.stackexchange.com/questions/126179/…他们帮助我了解了如何计算p值,希望您能找到它们也有帮助。
Giacomo

Answers:


7

由于以下几个原因,这是不正确的:

  1. 对于其他值,模型“无” X4不必具有相同的系数估计。拟合简化后的模型,自己看看。

  2. ÿ

  3. 为系数的统计显着性进行的统计检验是一个样本t检验。这是令人困惑的,因为我们没有X4的多个系数的“样本”,但是使用中心极限定理可以估计这种样本的分布特性。平均值和标准误差描述了这种极限分布的位置和形状。如果将“ Est”列除以“ SE”,然后与标准正态分布进行比较,则会在第4列中获得p值。

  4. 第四点:对minitab帮助页面的批评。这样的帮助文件不能在一个段落中总结多年的统计培训,因此我不需要一概而论。但是,说“预测变量”是“重要的贡献”是模糊的,而且可能是错误的。选择在多变量模型中包括哪些变量的基本原理是微妙的,并且依赖于科学推理而不是统计推断。


0

您对p值的最初解释似乎是正确的,这是因为仅截距的系数与0显着不同。您会注意到x4的系数估算值仍然很高,但是存在足够的误差,它并不显着不同于0。

您对y1和y2的配对t检验表明,模型彼此不同。可以预料的是,在一个模型中,您包含了一个很大但不精确的系数,这对您的模型起了很大的作用。没有理由认为这些模型的p值彼此不应该与x4系数的p值不等于0相同。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.