通常,您不能从概率回归的输出中解释系数(至少不是以任何标准方式)。您需要解释回归变量的边际效应,即,当更改所有回归变量的某些值不变时,更改变量的值时,结果变量的(条件)概率会变化多少。这与您直接解释估计系数的线性回归情况不同。这是因为在线性回归情况下,回归系数是边际效应。
在概率回归中,一旦计算了概率回归拟合,就需要额外的计算步骤来获得边际效应。
线性和概率回归模型
概率回归:回想一下,在概率模型中,您正在模拟“成功”结果的(条件)概率,即,
其中是标准正态分布的累积分布函数。这基本上说,在回归变量的条件下,结果变量为1 的概率是回归变量线性组合的特定函数。P [ ÿ 我 = 1 | X 1 我,... ,X ķ 我 ; β 0,... ,β ķ ] = Φ (β 0 + ķ Σ ķ = 1 β ķ X ķ 我)Φ (⋅ )ÿ 我Yi=1
P[Yi=1∣X1i,…,XKi;β0,…,βK]=Φ(β0+∑k=1KβkXki)
Φ(⋅)Yi
线性回归:将其与线性回归模型进行比较,其中
E(Yi∣X1i,…,XKi;β0,…,βK)=β0+∑k=1KβkXki
的(条件)均值是回归变量的线性组合。
边际效应
除了线性回归模型外,系数很少具有任何直接解释。我们通常是为有志于在其他条件不变的影响结果变量的功能回归量变化的影响。这就是边际效应衡量的概念。
- 线性回归:我现在想知道当我移动一个回归变量时结果变量的平均值移动了多少
∂E(Yi∣X1i,…,XKi;β0,…,βK)∂Xki=βk
但这只是回归系数,这意味着第个回归变量发生变化的边际效应就是回归系数。k
∂P[Yi=1∣X1i,…,XKi;β0,…,βK]∂Xki=βkϕ(β0+∑k=1KβkXki)
是
不一样的回归系数。这些是概率模型的
边际效应以及我们所追求的数量。特别是,这取决于所有其他回归变量的值以及回归系数。这里是标准的正态概率密度函数。
ϕ(⋅)
您如何计算此数量?应输入此公式的其他回归变量有哪些选择?值得庆幸的是,Stata在概率回归后提供了此计算,并提供了其他回归变量选择的一些默认值(这些默认值之间没有统一的协议)。
离散回归
请注意,由于我们使用了演算,因此上述大部分内容都适用于连续回归的情况。如果是离散回归,则需要使用离散更改。因此,例如,采用值的回归变量的离散变化为Xki{0,1}
ΔXkiP[Yi=1∣X1i,…,XKi;β0,…,βK]=βkϕ(β0+∑l=1k−1βlXli+βk+∑l=k+1KβlXli)−βkϕ(β0+∑l=1k−1βlXli+∑l=k+1KβlXli)
计算Stata中的边际效应
概率回归:这是在Stata中进行概率回归后计算边际效应的示例。
webuse union
probit union age grade not_smsa south##c.year
margins, dydx(*)
这是您将从margins
命令中获得的输出
. margins, dydx(*)
Average marginal effects Number of obs = 26200
Model VCE : OIM
Expression : Pr(union), predict()
dy/dx w.r.t. : age grade not_smsa 1.south year
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
age | .003442 .000844 4.08 0.000 .0017878 .0050963
grade | .0077673 .0010639 7.30 0.000 .0056822 .0098525
not_smsa | -.0375788 .0058753 -6.40 0.000 -.0490941 -.0260634
1.south | -.1054928 .0050851 -20.75 0.000 -.1154594 -.0955261
year | -.0017906 .0009195 -1.95 0.051 -.0035928 .0000115
------------------------------------------------------------------------------
Note: dy/dx for factor levels is the discrete change from the base level.
例如,这可以解释为age
变量的一个单位变化会使联合状态的概率增加0.003442。同样,从南方来,联盟身份的可能性降低 0.1054928
线性回归:作为最后的检验,我们可以确认线性回归模型中的边际效应与回归系数相同(略有扭曲)。运行以下回归并计算之后的边际效应
sysuse auto, clear
regress mpg weight c.weight#c.weight foreign
margins, dydx(*)
只是给您回归系数。请注意,有趣的事实是,Stata计算回归器的净边际效应,包括模型中包含的二次项的效应。
. margins, dydx(*)
Average marginal effects Number of obs = 74
Model VCE : OLS
Expression : Linear prediction, predict()
dy/dx w.r.t. : weight foreign
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
weight | -.0069641 .0006314 -11.03 0.000 -.0082016 -.0057266
foreign | -2.2035 1.059246 -2.08 0.038 -4.279585 -.1274157
------------------------------------------------------------------------------