具有对数偏移量的二进制模型(Probit和Logit)


12

是否有人对偏移量在probit和logit等二进制模型中的工作原理有任何推论?

我的问题是,后续窗口的长度可能会有所不同。假设患者接受了预防性治疗。这个镜头发生在不同的时间,所以如果结果是是否二进制指示任何的突发事,你需要调整的事实,有些人有更多的时间来展示症状。爆发的可能性似乎与随访时间的长短成正比。对我而言,数学上尚不清楚,具有偏移量的二进制模型如何捕获这种直觉(与Poisson不同)。

偏移量是Stata(p.1666)R的标准选项,对于Poisson来说我很容易看到它,但是二进制情​​况有点不透明。

例如,如果我们有 在代数上等于模型,其中 是标准模型,上的系数限制为。这称为对数偏移量。如果我们将替换为或我很难弄清楚它是如何工作的。

E[y|x]Z=exp{xβ},
E[y|x]=exp{xβ+logZ},
logZ1exp{}Φ()Λ()

更新#1:

下面说明了logit情况。

更新#2:

这是对非泊松模型(如Probit)的偏移量主要用途的解释。该偏移量可用于对指标函数系数进行似然比测试。首先,您要估算无约束模型并存储估算值。假设您要检验的假设。然后,创建变量,将模型删除并使用作为非对数偏移量进行拟合。这是约束模型。LR测试将两者进行比较,并且可以替代常规的Wald测试。βx=2z=2xxz

Answers:


8

您始终可以在任何 GLM中包括一个偏移量:它只是一个预测变量,其系数固定为1。泊松回归恰好是一个非常普遍的用例。

请注意,在二项式模型中,以对数曝光为偏移量的类似物只是二项式分母,因此通常无需明确指定它。正如您可以将Poisson RV建模为以对数曝光作为偏移量的计数以曝光率作为权重的比率进行建模一样,您也可以类似地将二项式RV建模为成功和失败的计数,将试验的频率建模为一个重量。

在logistic回归中,您将用比值比解释偏移:比例变化会导致比例变化。logZZp/(1p)

log(p/(1p))=βX+logZp/(1p)=Zexp(βX)

但这没有像泊松回归中的对数曝光那样特别重要。就是说,如果您的二项式概率足够小,则逻辑模型将接近具有对数链接的泊松模型(因为LHS的分母接近1),并且偏移量可以被视为对数暴露项。

(在链接的R问题中描述的问题相当特殊。)


我对两者的等效性的理解缺少加权部分。那很有帮助。我仍然有些困惑,如何将转换为关于爆发的概率与跟踪周期的长度,尽管我可以看到它在是如何增加的。Pr(Y=1|X)=Φ(xβ+ln(t))tt
Dimitriy V. Masterov

这不是概率,而是几率。希望编辑可以使其更清晰。
2013年

用优势比来表达问题就很清楚了。概率呢?
Dimitriy V. Masterov

由于不是规范链接,并且带有probit的二进制因变量不属于指数族,所以我不希望这对probit起作用,或者至少具有清晰的解释。Φ()
StasK

@StasK似乎正确,但是为什么这些选项在Stata和R中存在?他们完成了什么?
Dimitriy V. Masterov

1

将其重现为事件到时间的问题,具有ln(time)偏移量的逻辑模型是否不会有效地使您采用可能适合或可能不适合数据的参数生存函数?

p /(1-p)= Z * exp(xbeta)

p = [Z * exp(xbeta)] / [1 + Z * exp(xbeta)]

在时间Z时的预测生存率= 1- [Z * exp(xbeta)] / [1 + Z * exp(xbeta)]

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.