Probit和Logit模型的边际效应


12

谁能用外行的术语解释如何计算Probit和Logit模型的边际效应?

我是统计学新手,对这两种模型感到困惑。


请注意,从Probit和Logit模型得出的数字看起来好像它们度量的是大致相同的事物,但是在数值上常常不同。当您将它们转换回现实生活时,两者之间的差异通常会小得多。
亨利

Answers:


15

我认为查看给定变量的边际效应的更好方法是在垂直轴上生成预测概率的散点图,在水平轴上生成X j。这是我可以想到的最“外行”的方式,它指示给定变量的影响力。没有数学,只有图片。如果您有很多数据点,则箱线图或散点图平滑器可能有助于查看大多数数据的位置(与仅是点云相对)。XjXj

不确定下一节的“ Layman”如何,但是您可能会发现它很有用。

如果我们看一下边际效应,称之为,指出p = Σ ķ X ķ β ķ,我们得到mjg(p)=kXkβk

mj=pXj=βjg[g1(XTβ)]=βjg(p)

因此,边际效应取决于beta之外的估计概率和链接函数的梯度。由分割,来源于链规则分化,而事实上,- 1Ž g(p)。这可以通过对显然为真的方程z=g[g1z]的两侧进行微分来显示。我们也有-1XŤβ=p的定义。对于logit模型,我们有gp=logplog1pg1(z)z=1g[g1(z)]z=g[g1(z)]g1(XTβ)=p,边际效应为:g(p)=log(p)log(1p)g(p)=1p+11p=1p(1p)

mjlogit=βjp(1p

这是什么意思?井在p = 0p = 1时为零,在p = 0.5时达到最大值0.25。因此,当概率接近0.5时,边际效应最大,而当p接近0或接近1时,边际效应最小。然而,p 1 - p 仍取决于X Ĵ,所以边际效应是复杂的。实际上,因为这取决于p(1p)p=0p=10.25p=0.50.5p01p(1p)Xj,对于不同的 X k您将获得不同的边际效应p值。可能只是做一个简单的散点图的好理由-不需要选择要使用的协变量的值。Xk,kj

对于probit模型,我们有,其中Φ是标准正态CDF,和φ是标准正态pdf文件。这样我们得到:g(p)=Φ1(p)g(p)=1ϕ[Φ1(p)]Φ(.)ϕ(.)

mjprobit=βjϕ[Φ1(p)]

注意,这具有大部分属性,所述边际效应我先前所讨论的,并且是任何链接函数,它是对称的同样正确0.5(和清醒,当然,例如p = 一个ñ πmjlogit0.5)。对p的依赖更为复杂,但仍具有一般的“驼峰”形状(最高点为0.5,最低点为01)。链接功能将更改最大高度的大小(例如,probit最大值为1Gp=Ť一种ñπ2[2p-1个]p0.501个,分对数是0.25),如何迅速边际效应是锥形朝零。1个2π0.40.25


effectsR中的程序包可以轻松在垂直轴上生成预测概率图,而在水平轴上生成X则图。参见socserv.socsci.mcmaster.ca/jfox/Misc/effects/index.html
landroni 2015年


5

logit和probit模型通常用于基于多个输入变量来计算因变量y为0或1的概率。

用英语:假设您正在尝试预测二进制值,例如某人一生中是否会患心脏病。您有许多输入变量,例如血压,年龄,他们是否吸烟,他们的BMI,他们的居住地等等。所有这些变量都可能以某种方式导致某人患上心脏病的机会。

单个输入变量的边际影响是,如果您将该变量稍微提高一点,那将如何影响患心脏病的可能性?假设血压略有升高,这如何改变患心脏病的机会?或者,如果您将年龄提高一年?

其中一些影响也可能是非线性的:将BMI略微增加对BMI非常健康的人可能与对BMI不健康的人有非常不同的影响。


1

您仍然希望您的外行知道微积分,因为边际效应是针对感兴趣变量的拟合概率的导数。由于拟合概率是应用于拟合值的链接函数(logit,probit或其他),因此需要链式规则来计算它。因此,在线性索引模型(参数输入像X'b)中,它等于参数估计乘以链接函数的导数。由于导数在回归值的不同值上是不同的(与线性模型不同),因此您必须决定在哪里评估边际效应。自然的选择是所有回归变量的平均值。另一种方法是评估每个观察值的效果,然后对其平均。解释相应地有所不同。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.