尽管统计上没有统计学意义,何时应在回归中包括变量?


37

我是一名经济学经济学的学生,在计量经济学和R方面有一定的经验。我想知道是否存在过尽管变量在统计上不显着但是否应该在回归中包含变量的情况?


1
在医学研究中,如果涉及定性相互作用,则应将其包括在内。请参阅我之前在这里引用的Lacey Gunter的作品。也是Springer在2013年出版的Chakraborty和Moodie的书。标题是动态治疗体制的统计方法:强化学习,因果推论和个性化医学。
Michael Chernick

11
还应考虑统计意义完全是任意的。有什么重要意义?0.05?0.1?0.001?如果存在包括预测变量的理论基础,则足以保留它。
阿什

2
当您说“在统计上不显着”时,您会意识到置信水平为5%,这是一个任意选择吗?(还有更多的变量,则会引发多重测试问题)。
smci

1
@smci 0.05 = 5%的显着性水平对应于95%的置信度,有足够的理由避免混淆同一句子中的术语。由于存在重要的程序而没有可信度的间隔,因此通常更容易使用更相关的术语。在入门级解释链接时会例外。
Nick Cox

Answers:


30

是!

系数在统计上与零没有区别,并不表示该系数实际上为零,也不表示该系数不相关。一个效果没有通过任意的统计截止值并不意味着一个人不应该试图控制它。

一般而言,眼前的问题和您的研究设计应指导将哪些内容包括在内。

一些简单的例子:

而且也没有把这个作为一个详尽的清单。不难提出更多建议...

1.固定效果

这种情况经常发生的是具有固定影响的回归。

假设您有面板数据,并且想要估算模型中的:b

yit=bxit+ui+ϵit

用将视为固定效应的普通最小二乘法估计该模型等效于使用每个的指标变量运行普通最小二乘。uii

无论如何,关键是变量(即指标变量上的系数)通常估算不佳。任何单独的固定效应通常在统计上重要。但是,如果考虑到固定效应,您仍将所有指标变量包括在回归中。uiui

(还要注意,使用内置方法时,大多数统计信息包甚至都不会为您提供单个固定效果的标准错误。您实际上并不关心单个固定效果的重要性。您可能确实关心它们的集体意义。 )

2.一起使用的功能...

(a)多项式曲线拟合(注释中的提示@NickCox)

如果要将次多项式拟合到某条曲线,则几乎总是包含低阶多项式项。k

例如,如果要拟合二阶多项式,则应运行:

yi=b0+b1xi+b2xi2+ϵi

通常,强制而是运行 会很奇怪b1=0

yi=b0+b2xi2+ϵi

但是牛顿力学的学生将能够想象例外。

(b)AR(p)模型:

假设您要估算一个AR(p)模型,并且还要包括低阶项。例如,对于AR(2),您将运行:

yt=b0+b1yt1+b2yt2+ϵt

运行起来将很奇怪:

yt=b0+b2yt2+ϵt

(c)三角函数

正如@NickCox提到的,和术语类似地倾向于并存。有关更多信息,请参见例如本文cossin

更广泛地...

当有充分的理论理由时,您希望包括右侧变量。

正如此处以及在StackExchange上讨论的其他答案一样,逐步选择变量会产生许多统计问题。

区分以下内容也很重要:

  • 从零角度统计上难以区分的系数,并且标准误差很小
  • 在标准差大的情况下,该系数与零在统计上无法区分。

在后一种情况下,争论系数无关紧要。它可能只是测量不佳。


谈到您的第一个示例,我们将保留在模型中的原因似乎是因为的解释会改变是否在模型中。(请参见例如en.wikipedia.org/wiki/Partial_regression_plot-我们使用类似短语“控制的线性效应”之类的)。在这种情况下,模型中没有的重要性,我们将其用于给出的解释。 b ü ü ü uibuiuiui
user795305

5
一些非常好的答案,尽管它们已经有些重叠,所以在这里我将示例局限于此。多项式拟合:最常见的是,二次方几乎总是应该通过线性和平方项的双重作用来拟合。即使只有一个术语在常规水平上很重要,它们的共同作用也是关键。三角函数预测器同样,即使不符合常规水平,正弦和余弦也通常在一起。因此,应采取双重行动。
尼克·考克斯

2
@NickCox因为这是社区Wiki,并且您的观点与此处提出的观点直接相关,所以我认为您的评论应在适当的时候被编辑为答案。在我看来,仅留下评论是非常重要的,尽管我认为您是对的,但最好不要将其作为独立答案
Silverfish

欢迎@Silverfish Matthew复制它。但是,对我进行编辑似乎有些冒昧。
Nick Cox

1
@NickCox哈哈,我不在乎。:)我添加了您的建议,随时可以编辑!
马修·冈恩

14

是的,有。如果未包括在内,则任何可能以有意义的方式与您的响应变量相关联的变量(即使在统计学上不重要的水平)也可能使您的回归感到困惑。这称为规格不足,导致参数估计不如预期的那样准确。

https://onlinecourses.science.psu.edu/stat501/node/328

从上面:

如果回归方程缺少一个或多个重要的预测变量,则回归模型的规格不足(结果2)。这种情况可能是最坏的情况,因为未指定的模型会产生偏差的回归系数和偏差的响应预测。也就是说,在使用模型时,我们将始终低估或高估人口斜率和人口均值。更糟的是,已经很糟糕的问题变得更加严重,均方误差MSE往往会高估σ²,从而产生比应有的更大的置信区间。


4
那不是真的。为了成为混淆变量,需要引起解释变量感兴趣的解释变量的影响。如果原因可变利率解释变量,它影响结果,那么它就是一个中介变量,你应该为它控制(除非你想分解的总效应)。
Maarten Buis

1
这是关于混杂控制问题的非常不充分的讨论。与结果的相关性并不是混淆的充分条件,并且可能通过控制介体而导致因果模型的错误指定:这导致了谬论,例如“控制冠状动脉钙(CAC)后戒烟并不会降低心血管疾病的风险”。CAC是吸烟使您罹患心脏病的主要方式。见因果关系的明珠,第2版,第3章第3节
阿达莫

随时编辑。我不认为他在寻找答案的深度,如果我的简短导致严重不正确,我深表歉意。
Doubletrouble

11

通常,由于它们的重要性,因此不包括或排除线性回归变量。之所以包含它们,是因为您假设所选变量是回归标准的(良好)预测变量。换句话说,预测变量的选择是基于理论的。

线性回归中的统计无关紧要可能意味着两件事(我知道):

  1. 无关紧要的预测因素与标准无关。排除它们,但请记住,这些无关紧要的事实并不表示它们无关。检查你的理论。
  2. 预测变量并不重要,因为它们可以表示为其他预测变量的函数。预测变量的集合然后称为多重共线性。这不会使预测变量在任何意义上都是“坏的”,而是多余的。

排除无关紧要的预测因素的有效原因是,您正在寻找能解释标准差异或其中大部分标准的最小预测因素子集。如果找到它,请检查您的理论。


回归标准的[P]个预测因子?您可能希望对此重新表述。
理查德·哈迪

8

在计量经济学中,这种情况左右发生。例如,如果您使用的是季度季节性假人Q2,Q3和Q4,那么作为一个组,它们通常很重要,但是其中一些单独而言并不重要。在这种情况下,通常将它们全部保留。

yxzzxz

更新:另一个常见的例子是预测。经济学计量学通常是从经济学系的推理角度讲授的。从推理的角度来看,很多注意力都集中在p值和重要性上,因为您正试图了解是什么导致了什么等等。在预测中,并没有过多地关注这些内容,因为您所关心的只是模型可以预测目标变量的程度。

这类似于机器学习应用程序,顺便说一句,它们最近进入了经济学领域。您可以建立一个模型,其中包含所有预测不佳的重要变量。在ML中,它通常与所谓的“过度拟合”相关联。显然,在预测中很少使用这种模型。


1
在某些时候,这似乎有点夸张。例如,对我来说,即使仅作为教科书的非经济学家,也已经证明,至少在几十年中,经济学家已经广泛地接受了预测。我是否会留给内部人一个更微妙的问题,是否增加了“最近的”(确切的意思是?)。
Nick Cox

@NickCox,同意,听起来好像课程中根本没有任何预测,这是不正确的。
阿克萨卡尔州

7

您在问两个不同的问题:

  1. 什么时候统计意义不重要?
  2. 尽管变量在统计上不显着,但何时应在回归中包括变量?

编辑:对于原始帖子,这是正确的,但在编辑后可能不再正确。


关于第一季度,我认为它已经太广泛了。有许多可能的答案,其中一些已经提供。另一个示例是在构建预测模型时(请参阅下面引用的源以获取解释)。


关于第二季度,统计意义不是建立模型的合理标准。Rob J. Hyndman在他的博客文章“变量选择的统计检验”中写道:

尽管有许多本应该更好地使用变量的事实,但统计意义通常不是确定变量是否应包含在模型中的良好基础。统计检验旨在检验假设,而不是选择变量。

还要注意,您经常可以发现一些纯粹是偶然地具有统计学意义的变量(该机会由您选择的显着性水平来控制)。仅观察到变量在统计上是重要的,不足以得出该变量属于模型的结论。


4

我将添加另一个“是”。一直以来,我一直被教导-并且我一直试图将它传递给我-协变量选择的主要考虑因素是领域知识,而不是统计数据。例如,在生物统计学中,如果我要对个人进行一些健康结局建模,那么无论回归结果如何,您都需要一些令人难以置信的合理论据,使我不要在模型中包括年龄,种族和性别。

这也取决于模型的目的。如果目的是更好地了解与您的结果最相关的因素,那么建立一个简约的模型会有一些好处。如果您只关心预测,而不是那么了解,那么消除协变量可能是一个较小的问题。

(最后,如果您打算使用统计信息进行变量选择,请查看弗兰克·哈雷尔对此主题的看法-http: //www.stata.com/support/faqs/statistics/stepwise-regression-problems/,以及他的《回归建模策略》一书,简而言之,当您使用逐步的或类似的基于统计的策略来选择最佳预测变量时,任何关于“这些良好预测变量吗?”的检验都存在极大的偏见- 当然,它们好的预测变量,您是在此基础上选择它们的,因此这些预测变量的p值错误地低。)


1
R2

4

“统计上的无关紧要”的结果真正说的唯一一件事是,在选定的I类错误级别上,我们甚至无法确定回归变量对因变量的影响是正还是负(请参阅此文章)。

因此,如果我们保留该回归变量,则任何有关其对因变量的影响的讨论都没有统计证据可支持。

但是这种估计失败并不是说回归变量不属于结构关系,而是说对于特定的数据集,我们不能确定地确定其系数的符号。

因此,原则上,如果存在支持其存在的理论论证,则应保留回归器。

此处的其他答案提供了在其中将此类回归器保留在规范中的特定模型/情况,例如,提及固定效果面板数据模型的答案。


为什么将“置信度”拖入对意义的讨论中?我经常在较差的文章和论文中读到诸如“在99%的置信度时显着”这样的怪异现象。当然,这些想法之间是有联系的,但是您不需要这样的措辞(在基本层面上,它的含义会引起混淆,请注意)。
Nick Cox

@尼克·考克斯你有一点。我将其更改为“ Type I error”。
Alecos Papadopoulos

1

如果它是研究的重点,即使没有统计学意义,您也可以包括一个特别感兴趣的变量。同样,在生物统计学中,临床意义通常不同于统计学意义。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.