如何测试回归系数是否受分组变量影响?


9

我根据调节变量(例如性别)对两组样本进行了回归。我正在通过检查回归的显着性是否在一组中丢失而在另一组中保留,来对调节效果进行简单测试。

Q1:上述方法是有效的,不是吗?

问题2:我的研究的置信度设置为95%。对于一组,回归显着为.000。另一方面,它在0.038处是显着的。因此,我相信我必须接受两个回归都是显着的,并且没有缓和作用。通过接受回归在显着性不是0.01时很重要,是否会导致I型错误(接受伪造的论点)?

Answers:


12

假设“调节效应”是两组之间一个或多个回归系数的变化,则您的方法似乎无法解决该问题。回归的显着性检验评估系数是否为非零。比较两个回归中的p值,几乎看不到(如果有的话)两个样本之间的系数差异

取而代之的是,将性别引入为虚拟变​​量,并将其与所有感兴趣的系数进行交互。然后测试相关系数的显着性。

例如,在最简单的情况下(一个自变量),您的数据可以表示为元组的列表,其中是性别,编码为和。性别的模型是(xi,yi,gi)gi010

yi=α0+β0xi+εi

(其中,索引的量,数据)和模型性别是igi=01

yi=α1+β1xi+εi

(其中索引了的数据)。参数为,,和。错误是。假设它们是独立的,并且均值分布为零。测试斜率差异()的组合模型可以写成igi=1α0α1β0β1εiβ

yi=α+β0xi+(β1β0)(xigi)+εi

(其中覆盖了所有数据),因为当您设置,最后一项会消失,给第一个模型提供,而当您将设置时,的两个倍数组合就,生成的第二个模型。因此,您可以通过拟合模型来测试斜率是否相同(“缓和效果”)igi=0α=α0gi=1xiβ1α=α1

yi=α+βxi+γ(xigi)+εi

并测试估计的缓和效果大小是否为零。如果您不确定截距是否相同,请加入第四项:γ^

yi=α+δgi+βxi+γ(xigi)+εi.

如果这没有任何意义,则不必测试是否为零:它包括在内,以允许对两个性别进行单独的线性拟合,而不必强制它们具有相同的截距。δ^

这种方法的主要局限性是假设两个性别的误差的方差相同。如果不是这样,则您需要考虑到这种可能性,这需要对软件进行更多的工作以适合模型,并需要对如何测试系数的重要性进行更深入的考虑。εi


谢谢,我能理解它是如何工作的。如果我有多个调节变量,此方法有效吗?例如说地区(农村/城市),教育程度(高中/未受过教育)?我可以添加其他虚拟变量并测试效果吗?
蝎子

1
@whuber,我偶尔会遇到功能上相似的情况,在这种情况下,分析师将样本简单地分为两组,对两组使用相同的一组独立变量,然后定性地比较系数。我刚才描述的这种情况相对于使用交互作用的描述有什么优势吗?
安迪W

3
@Andy不想发声批评或贬低,我可以想到的定性方法的唯一优点是,它不需要分析师的理解或能力:这使更多的人可以使用它。定性方法充满了困难。例如,仅靠偶然的机会,斜率和截距之间就可能存在较大的表观差异。仅对系数进行定性评估将无法将这种情况与实际效果区分开。
ub

1
@whuber,我最初的想法是一样的,最近我向一位同事给出了相同的建议,该同事为了简单起见而忽略了该建议(正如您所提到的)。我认为也许关于误差方差对于两个性别相同的假设的评论可能会使两种模型方法更合适,因为这违反了假设。
安迪W

1
@Andy是的,但是不同方差的可能性不会增加非定性比较的价值。而是需要对参数估计值进行更细微的定量比较。例如,作为一种粗略(但有用的)近似值,可以根据估计的误差方差及其自由度执行CABF或Satterthwaite t检验的变体。与简单地比较回归系数相比,即使是对结构良好的散点图的目视检查也将很容易实现,并且信息量也更大。
ub

-1

我猜想在比较独立横截面数据波的回归系数(例如,第1年,第2年和第3年作为第1组,第2组和第3组)时,对分组变量进行调整会同样有效吗?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.