比较各个模型之间的逻辑回归系数?


11

我已经开发了一个logit模型,该模型将应用于六组不同的横截面数据。我要揭示的是,给定自变量(IV)对因变量(DV)的实质性影响是否发生变化,从而控制了在不同时间和跨时间的其他解释。

我的问题是:

  • 如何评估IV和DV之间关联的大小增加/减少?
  • 我可以简单地查看模型中系数的不同大小(大小),还是需要执行其他过程?
  • 如果我需要做其他事情,那是什么,它可以完成/如何在SPSS中完成?

    而且,在单个模型中

  • 如果所有变量都编码为0-1,是否可以基于非标准化分数比较自变量的相对大小?还是需要将它们转换为标准化分数?
  • 标准化分数有问题吗?

2
这篇文章可能是dx.doi.org/10.1093/esr/jcp006,与Logistic模型之间的比较显然比在OLS情况下复杂得多!
Andy W

Answers:


13

我将主要关注您的前三个问题。简短的答案是:(1)您需要比较每个时间段IV对DV的影响,但(2)仅比较幅度可能会得出错误的结论,并且(3)有很多方法可以做到这一点,但是对于哪一个是正确的没有共识。

下面我将描述为什么您不能简单地比较系数幅值并为您提供到目前为止已经想到的一些解决方案。

根据Allison(1999),与OLS不同,逻辑回归系数受未观察到的异质性影响,即使这种异质性与目标变量无关。

当您拟合逻辑回归时,例如:

(1)

ln(11pi)=β0+β1x1i

实际上,您正在拟合一个预测潜在变量的值的方程,该变量表示每个观察值假定二元因变量中值为的潜在倾向,如果高于某个阈值,会发生什么。其等式为(Williams,2009年): 1 y y1y

(2)

y=α0+α1x1i+σε

术语被假定为独立于其它术语,并按照一个物流配送-或概率的情况下的正常分布和互补双对数的情况下的对数的物流分布和柯西分布的情况下柯西特。ε

根据Williams(2009),公式2中的系数与公式1中的系数有关,其计算公式如下:βαβ

(3)

βj=αjσj=1,...,J.

在等式2和3中,是未观察到的变化的比例因子,我们可以看到,估计的系数的大小取决于,而未观察到。基于此,Allison(1999),Williams(2009)和Mood(2009)等声称,您不能天真地比较针对不同群体,国家或时期估算的逻辑模型之间的系数。β σσβσ

这是因为如果组,国家或时期之间的未观察到的变化不同,则比较可能得出错误的结论。使用不同模型的比较和使用同一模型内的交互项的两个比较都存在此问题。除logit之外,这还适用于其表亲概率,阻塞对数,cauchit以及扩展到使用这些链接函数估计的离散时间危害模型。有序logit模型也受它影响。

Williams(2009)认为解决方案是通过异构选择模型(即位置比例模型)对未观察到的变化进行建模,并oglm 为此提供了Stata补充(Williams 2010)。在R中,异构选择模型可以与程序包的hetglm()功能相适应,该功能glmx可通过CRAN获得。这两个程序都非常易于使用。最后,Williams(2009)提到了SPSS PLUM拟合这些模型的例程,但我从未使用过它,也无法评论它的易用性。

但是,至少有一份工作论文表明,如果方差方程指定不正确或存在测量误差,则使用异构选择模型进行的比较甚至会有更大的偏差。

Mood(2010)列出了其他解决方案,这些解决方案不涉及对方差建模,而是使用预测的概率变化进行比较。

显然,这是一个尚未解决的问题,我经常在自己领域(社会学)的会议上看到针对该问题提出不同解决方案的论文。我建议您查看您所在领域的人在做什么,然后决定如何处理它。

参考文献


我正在尝试在R中实现Williams(2009)解决方案,而且glmx软件包的新版本似乎不再具有hetprob()函数。只想检查您是否知道其他替代方法?
AliCivil

1
我已经有一段时间没有使用glmx了,也不知道它已经改变了。现在,它可以通过CRAN使用,并且用于定点概率的函数显然称为hetglm()。我将更新此答案以在以后反映出来(这是在睡觉的时间)。我希望这会有所帮助。
肯吉

3

数据集之间是否有变化?我可以不看数据就回答!是。有。他们多大?那是关键。对我来说,看的方式就是看。您将对每个数据集的每个自变量都有比值比-它们在人们发现有趣的方式上是否不同?现在,的确每个人都有一个标准错误,依此类推,也许可以通过多种方法来查看它们在统计上是否彼此显着不同,但这真的是一个有趣的问题吗?如果是这样,那么使用软件轻松对其进行测试的一种方法是将所有研究组合在一起,并将“研究”作为另一个自变量。如果需要,您甚至可以测试交互。是否要执行此操作取决于您的实质性问题。

关于比较模型中的变量,标准化分数的主要问题是它们在您的特定样本上是标准化的。因此,参数估计值等等是根据您特定样本中变量的标准偏差得出的。即使您的样本确实是某个总体中的随机样本,它与其他随机样本的标准偏差也将(略有不同)。这使事情变得混乱。

另一个问题是“相对大小”问题的含义。如果您的IV是应该被很好理解的东西,那么您可以跨范围比较有意义的OR。


非常有用,谢谢彼得。我问第一个问题的原因是因为我已经确切地看到了-在参考论文中样本之间模型之间的系数比较以及不同样本之间模型之间的比较。我不认为这是正确的方法,显然,我是正确的。关于技术细节,我不能简单地估计所有六个样本的模型以及我要比较的关键预测变量与指定每个样本的变量(表示不同的时间段)之间的交互项吗?那是你的意思吗 我是否需要为每个变量设置一个变量
Ejs 2011年

嗨@ejs。您将需要使用与任何其他类别变量相同的方式对“样本”进行编码-虚拟编码或效果编码或其他方式。
彼得·弗洛姆

关于交互..是的,它们可能难以解释。我喜欢以图形方式显示它们的含义。
彼得·弗洛姆

3

Guilherme在这里赚钱。尽管其他响应很有用,但请注意,逻辑回归(以及与此相关的所有非线性回归,例如Poisson)与线性回归根本不同。在六个不同的数据集上运行相同的分析,然后在组合的数据集上运行该分析时,logit比例因子可能存在严重问题。系数的变化可能与有意义的差异无关(即使在统计上显着或实质上重要)。他们可能与样本中所有未观察到的异质性有关。您绝对必须对此进行测试。社会和政策科学领域的许多(如果不是大多数的话)研究人员都忽略了这一点。Guilherme对此发表了开创性的文章,我建议大家都看一下。彼得的建议是切实可行的,但是仅对数据来自的样本编码一个虚拟变量将无法解决缩放因子的这种异质性。您可以在线性回归中做到这一点,异质性不应影响您的系数,但在这里可能会影响系数。

Logit与线性回归唯一的未观察到的异质性影响的另一个方面是每个数据集中不同回归变量的影响。如果您没有相同的变量,或者可能以不同的方式来衡量它们,则可以使用省略变量偏差的形式。与线性回归不同,与关键回归变量正交的省略变量仍然可以使您的估计偏倚。正如Cramer所说:

因此,即使具有正交回归变量,相对于完整方程中的值,省略的变量也会将 hatβ压低至零。换句话说,离散模型的 hatβ与未观察到的异质性程度成反比。实际结果是,在这方面不同的样本得出的估计值无法直接比较。(http://dare.uva.nl/document/2/96199β^β^

克莱默还指出,尽管省略变量时,系数估计会向下偏移,但偏导数却不会。这是相当复杂的,您应该阅读文章以获得更清晰的解释–总体而言,请不要仅查看对数奇数或比值比。考虑预测的概率和导数;有关更多详细信息,请参见Stata中的margins命令。JD Long的论文在这里进行了详细介绍。

最后,您可以在Google上找到许多论文,讨论logit模型中的交互作用术语。我的理解是,以交互作用的对数系数为指导,而不是确定的,尤其是如果您更喜欢将系数视为指数比值比。查看预测的概率和平均边际效果会更好(再次,请查阅有关Stata的margin命令进行logit的文档,即使您使用SPSS,这仍然会有所帮助)。

我对SPSS不太熟悉,无法知道该软件包如何处理这些问题,但是我会这样说:当您遇到像这样的更深层次的统计问题时,这表明您该到了更进一步的时候了。灵活,精致的软件包,例如Stata或R。


+1推荐边际效应和推荐移动到R.
贤治

1

另一个有用的工具是标准化回归系数,或至少是粗糙的伪版本。您可以通过将获得的系数乘以预测变量的标准偏差来获得一个这样的版本。(还有其他版本和关于最佳版本的争论,例如,参见Menard 2002,《应用逻辑回归分析》Google图书))。这将为您提供一种评估各项研究效果强度的方法。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.