我将主要关注您的前三个问题。简短的答案是:(1)您需要比较每个时间段IV对DV的影响,但(2)仅比较幅度可能会得出错误的结论,并且(3)有很多方法可以做到这一点,但是对于哪一个是正确的没有共识。
下面我将描述为什么您不能简单地比较系数幅值并为您提供到目前为止已经想到的一些解决方案。
根据Allison(1999),与OLS不同,逻辑回归系数受未观察到的异质性影响,即使这种异质性与目标变量无关。
当您拟合逻辑回归时,例如:
(1)
ln( 11 − p一世) =β0+ β1个X1 我
实际上,您正在拟合一个预测潜在变量的值的方程,该变量表示每个观察值假定二元因变量中值为的潜在倾向,如果高于某个阈值,会发生什么。其等式为(Williams,2009年): 1 y ∗ÿ∗1个ÿ∗
(2)
ÿ∗= α0+ α1个X1 我+ σε
术语被假定为独立于其它术语,并按照一个物流配送-或概率的情况下的正常分布和互补双对数的情况下的对数的物流分布和柯西分布的情况下柯西特。ε
根据Williams(2009),公式2中的系数与公式1中的系数有关,其计算公式如下:βαβ
(3)
βĴ= αĴσĴ = 1 ,。。。,J。
在等式2和3中,是未观察到的变化的比例因子,我们可以看到,估计的系数的大小取决于,而未观察到。基于此,Allison(1999),Williams(2009)和Mood(2009)等声称,您不能天真地比较针对不同群体,国家或时期估算的逻辑模型之间的系数。β σσβσ
这是因为如果组,国家或时期之间的未观察到的变化不同,则比较可能得出错误的结论。使用不同模型的比较和使用同一模型内的交互项的两个比较都存在此问题。除logit之外,这还适用于其表亲概率,阻塞对数,cauchit以及扩展到使用这些链接函数估计的离散时间危害模型。有序logit模型也受它影响。
Williams(2009)认为解决方案是通过异构选择模型(即位置比例模型)对未观察到的变化进行建模,并oglm
为此提供了Stata补充(Williams 2010)。在R中,异构选择模型可以与程序包的hetglm()
功能相适应,该功能glmx
可通过CRAN获得。这两个程序都非常易于使用。最后,Williams(2009)提到了SPSS PLUM
拟合这些模型的例程,但我从未使用过它,也无法评论它的易用性。
但是,至少有一份工作论文表明,如果方差方程指定不正确或存在测量误差,则使用异构选择模型进行的比较甚至会有更大的偏差。
Mood(2010)列出了其他解决方案,这些解决方案不涉及对方差建模,而是使用预测的概率变化进行比较。
显然,这是一个尚未解决的问题,我经常在自己领域(社会学)的会议上看到针对该问题提出不同解决方案的论文。我建议您查看您所在领域的人在做什么,然后决定如何处理它。
参考文献