测试系数之间的显着差异的正确方法是什么？

18

我希望有人能帮我解决一些困惑。假设我要测试2组回归系数是否显着不同，并进行以下设置：

向我建议的一种方法是使用Z检验：

$Z = \frac{b_1 - b_2}{\sqrt(SEb_1^2 + SEb_2^2)}$

我在该板上看到的另一个建议是引入一个虚拟变量进行分组并将模型重写为：

$y_i = \alpha + \beta x_i + \delta(x_ig_i) + \epsilon_i$ ，其中 $g$ 是分组变量，编码为0、1。

我的问题是，这两种方法有何不同（例如做出不同的假设，灵活性）？一个比另一个合适吗？我怀疑这是非常基本的，但是任何澄清将不胜感激。

regression hypothesis-testing multiple-regression

— 收银台
source

我相信类似问题的答案和评论可能会为您提供一些澄清。

— ub

谢谢你胡扯。我对这个答案很熟悉。在下面的讨论中，可接受的答案（以及您的评论）给我留下了这样的印象，即比较两个单独拟合的系数是不合适的。将z检验应用于来自单独拟合的系数是否正确，还是伪变量编码更简单并提供了等效答案？

— Cashoes 2011年

1

请参阅我的答复的最后一段（“主要限制...”）。假设大（否则在测试中使用）并且估计的标准偏差彼此相差则Z测试有效。当标准偏差相差很大（大约大于3：1的比率）时，这两种方法都不是最佳方法。

n_{i}

$n_i$

S E b_{i}

$SEb_i$

— ub

13

两种方法确实有所不同。

令两个回归的估计标准误差为和。然后，由于组合回归（具有所有系数-虚拟相互作用）拟合相同的系数，因此它具有相同的残差，因此可以将其标准误差计算为 $s_1$ $s_2$

s = \sqrt{\frac{(n_{1} - p) s_{1}^{2} + (n_{2} - p) s_{2}^{2})}{n_{1} + n_{2} - 2 p}} .

$s = \sqrt{\frac{(n_1-p) s_1^2 + (n_2-p) s_2^2)}{n_1 + n_2 - 2 p}}.$

在示例中，参数的数量等于：五个斜率和每个回归中的一个截距。 $p$ $6$

设估计一个回归中的参数，估计另一个回归中的相同参数，估计它们在组合回归中的差异。然后，他们的标准误差与 $b_1$ $b_2$ $b$

S E (b) = s \sqrt{(S E (b_{1}) / s_{1})^{2} + (S E (b_{2}) / s_{2})^{2}} .

$SE(b) = s \sqrt{(SE(b_1)/s_1)^2 + (SE(b_2)/s_2)^2}.$

如果你还没有完成组合的回归，但只对单独的回归统计，塞在以上公式中的。这将是t检验的分母。显然，它与问题中出现的分母不同。 $s$

组合回归的假设是，两个单独回归中残差的方差基本相同。但是，如果不是这种情况，则z检验也不会很好（除非样本量很大）：您可能要使用CABF检验或Welch-Satterthwaite t检验。

— ub
source

9

测试两组之间系数差异的最直接方法是在回归中包括一个交互项，这几乎就是您在问题中所描述的。您将运行的模型如下：

$y_i = \alpha + \beta x_i + \gamma g_i + \delta (x_i \times g_i) + \varepsilon_i$

请注意，我已将组变量作为单独的回归变量包括在模型中。在该模型中，具有零假设的检验是两组系数相同的检验。要看到这一点，首先在上述模型中让。然后，得到第0组的以下方程式： $t$ $H_0: \delta = 0$ $g_i = 0$

$y_i = \alpha + \beta x_i + \varepsilon_i$

现在，如果，则我们有： $g_i = 1$

$y_i = (\alpha + \gamma) + (\beta + \delta) x_i + \varepsilon_i$

因此，当为0时，则两组具有相同的系数。 $\delta$

— 马特·布莱克威尔
source

感谢您纠正模型（我相信上面的版本只是强制两组截距相同...）。更重要的是，这是否等同于我上面发布的z检验？

— Cashoes 2011年

如果想测试一个的效果是否是两个以上的组之间是不同的，将一个ANOVA比较模型

和一个在此答案中所示，

是适当的？

y_{i} = α + β x_{i} + γ g_{i} + ε_{i}

$y_i = \alpha + \beta x_i + \gamma g_i + \varepsilon_i$

y_{i} = α + β x_{i} + γ g_{i} + δ (x_{i} \times g_{i}) + ε_{i}

$y_i = \alpha + \beta x_i + \gamma g_i + \delta (x_i \times g_i) + \varepsilon_i$

— miura

@ matt-blackwell在概念上是否与按g的每个值分层模型相同？（即，当g = 0时b是x的系数，而当g = 1时b是β+δ的系数）尽管我很欣赏分层不允许统计比较。

— bobmcpop