具有交互作用项的联合模型与用于组比较的单独回归


13

在收集了先前问题和讨论的宝贵反馈后,我提出了以下问题:假设目标是检测两组之间的效果差异,例如男性与女性之间的差异。有两种方法可以做到这一点:

  1. 对两组进行两个单独的回归,并使用Wald检验拒绝(或不拒绝)原假设:,其中是男性回归中一个IV的系数,是相同回归中的系数四,女性退步。H0b1b2=0b1b2

  2. 将这两个组合并在一起,并通过包含性别虚拟对象和交互项(IV * genderdummy)来运行联合模型。然后,将基于交互作用的符号和显着性的t检验来检测组效应。

如果在情况(1)中拒绝Ho,即组差异很大,但是在情况(2)中交互项项的系数在统计上不重要,即组差异不重要,该怎么办。反之亦然,在情况(1)中不拒绝Ho,并且在情况(2)中交互项很重要。我几次都以这种结果告终,我想知道哪种结果会更可靠,以及这种矛盾背后的原因是什么。

非常感谢!


1
程序之间的区别在于,两组假定相同的方差。单独的分析采用不同的方差。
概率

非常感谢!您是否知道在比较不同模型时有任何讨论方差问题的参考文献?
Bill718

Answers:


7

第一个模型将性别与模型中的所有其他协变量完全交互。本质上讲,每个协变量(b2,b3 ... bn)的作用。在第二个模型中,性别的影响仅与您的IV相互作用。因此,假设您的协变量不只是IV和性别,那么结果可能会有所不同。

如果只有两个协变量,则有文献记载的情况下,Wald检验和似然比检验之间的最大化差异会导致不同的答案(请参阅Wikipedia上的更多内容)。

以我自己的经验,我尝试以理论为指导。如果有一个占主导地位的理论表明性别只会与IV交互,而不会与其他协变量交互,那么我将进行部分交互。


谢谢!是的,实际上有各种各样的协变量,不仅是一个IV,为了简单起见,我在问题中只提到了一个IV。问题是,没有一个强大的理论可以支持性别与某些协变量之间的相互作用,这是一种探索性分析,因此我需要尝试许多相互作用和模型拟合。初始模型包含30个预测因子...
Bill718

@ Bill718另外,单独的模型将具有不同的截距,而单独的模型将没有截距,除非您将性别单独指定为附加的IV(不只是作为交互)。
罗伯特·库布里克

5

每当使用两种不同的过程来检验特定的假设时,p值就会不同。要说一个很重要而另一个不重要,就只能在0.05水平上做出黑白决定。如果一个测试的p值为0.03,而另一个测试的p值为0.07,我不会认为结果矛盾。如果要严格考虑重要性,那么当出现董事会重要性时很容易出现情况(i)或(ii)。

正如我在回答上一个问题时提到的那样,我更希望寻找一种相互作用是进行一个组合回归。


是的,确实,至少在我看来,组合回归的表现似乎更好,这是一种非常灵活的方法,因为有人可以尝试不同的交互和模型拟合。我只是想通过“统计”好奇心说找出导致结果不同的原因是什么。关于p值,我听说有些人只接受a = 0.5%或更低水平的显着性。我使用1%的水平时更加灵活,但是当p值完全不同时,最大的麻烦就来了。
Bill718

我已经看到了一些研究,例如,当使用有序logit模式时,一个IV非常重要,而当应用OLS时,相同的IV变得无关紧要。因此,在那种情况下,对结果的解释可能会有些棘手。非常感谢您的评论和反馈!
Bill718

+1,大约的点非常好。0.070.03
gung-恢复莫妮卡

2

在第二种情况下,标准软件会建议您使用t学生p值的t统计量,而对于第一种情况,Wald测试可能有两个选择。在误差正态性假设下,Wald统计量遵循精确的Fisher统计量(由于假定误差为正态性,所以它等效于t统计量)。在渐近正态下,Wald统计量遵循Chi2分布(与非正态分布后的t-stat近似,近似于正态分布),您假设采用什么分布?取决于此,您的p值风险会给您带来不同的结果。

在教科书中,您会发现对于双边单项测试(一个参数),t学生和Fisher统计量均相等。

如果样本不大,那么比较chi2和t-stat p值肯定会得出不同的结果。在那种情况下,假设渐近分布是不合理的。如果您的样本很小,那么假设正态性似乎更合理,则分别意味着案例2和案例1的t-stat和Fisher p值。


确实,我有两个样本大小不相等,第一个样本有3000个观测值,但是第二个样本相对较小,有500个观测值。在计算Wald统计信息时,该软件将报告卡方。因此,这似乎是差异的原因。但是,两个样本都是正态分布的,尤其是在大样本的情况下。非常感谢!
Bill718 2012年

1
很抱歉欺骗您,但子样本大小不相等不是问题。而且,您的样品对我来说似乎是一个很大的样本。因此这两个过程应产生相似的结果。我注意到@probabilityislogic很好。使用一个合并的样本意味着相等的残差,因此可能是异质性的来源。不知道您如何实现单独的回归过程,但是如果您自己计算统计信息,很容易出错。这使得合并回归成为一种安全,简单的方法。
JDav

1
要解决各组之间的不均等方差问题(异方差性),请尝试使用White(如果使用stata,也称为Newey-west,Sandwich或Robust)方差估计量。这种方法纠正了异类继承的未知类型。
JDav

哦,好吧,我明白了,样本中的观察结果实际上来自一个国家的不同地区,所以我很可能存在异质性问题!
Bill718
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.