我希望有人能帮我解决一些困惑。假设我要测试2组回归系数是否显着不同,并进行以下设置:
- ,具有5个独立变量。
- 2组,大小大致相等,(尽管可能有所不同)
- 数以千计的相似回归将同时完成,因此必须进行某种形式的多重假设校正。
向我建议的一种方法是使用Z检验:
我在该板上看到的另一个建议是引入一个虚拟变量进行分组并将模型重写为:
,其中是分组变量,编码为0、1。
我的问题是,这两种方法有何不同(例如做出不同的假设,灵活性)?一个比另一个合适吗?我怀疑这是非常基本的,但是任何澄清将不胜感激。
我希望有人能帮我解决一些困惑。假设我要测试2组回归系数是否显着不同,并进行以下设置:
向我建议的一种方法是使用Z检验:
我在该板上看到的另一个建议是引入一个虚拟变量进行分组并将模型重写为:
,其中是分组变量,编码为0、1。
我的问题是,这两种方法有何不同(例如做出不同的假设,灵活性)?一个比另一个合适吗?我怀疑这是非常基本的,但是任何澄清将不胜感激。
Answers:
两种方法确实有所不同。
令两个回归的估计标准误差为和s 2。然后,由于组合回归(具有所有系数-虚拟相互作用)拟合相同的系数,因此它具有相同的残差,因此可以将其标准误差计算为
在示例中,参数的数量等于6:五个斜率和每个回归中的一个截距。
设估计一个回归中的参数,b 2估计另一个回归中的相同参数,b估计它们在组合回归中的差异。然后,他们的标准误差与
如果你还没有完成组合的回归,但只对单独的回归统计,塞在以上公式中的。这将是t检验的分母。显然,它与问题中出现的分母不同。
组合回归的假设是,两个单独回归中残差的方差基本相同。但是,如果不是这种情况,则z检验也不会很好(除非样本量很大):您可能要使用CABF检验或Welch-Satterthwaite t检验。
测试两组之间系数差异的最直接方法是在回归中包括一个交互项,这几乎就是您在问题中所描述的。您将运行的模型如下:
请注意,我已将组变量作为单独的回归变量包括在模型中。在该模型中,具有零假设H 0:δ = 0的检验是两组系数相同的检验。要看到这一点,首先在上述模型中让g i = 0。然后,得到第0组的以下方程式:
现在,如果,则我们有:
因此,当为0时,则两组具有相同的系数。