2SLS,但第二级Probit


15

我正在尝试使用工具变量分析来推断观测数据的因果关系。

我遇到了两阶段最小二乘(2SLS)回归,这很可能可以解决我研究中的内生性问题。但是,我希望第一阶段成为OLS,第二阶段成为2SLS中的Probit。根据我的阅读和搜索,我已经看到研究人员使用2SLS或第一阶段的Probit和第二阶段的OLS,但并非相反,这正是我想要达到的目标。

我目前正在使用Stata,并且Stata中的ivreg命令用于直接2SLS。

Answers:


12

您的案子没有其他问题那么麻烦。期望值和线性预测运算符经历线性第一阶段(例如OLS),但不经历诸如probit或logit之类的非线性过程。因此,如果您先将连续的内生变量回归到仪器,这不是问题, 然后在第二阶段的概率中使用拟合值来估算 Xž

X一世=一种+ž一世π+η一世
ÿ一世=1|X^一世=βX^一世+ϵ一世>0

标准错误将是不正确的,因为不是随机变量,而是估计数量。您可以通过同时引导第一阶段和第二阶段来纠正此问题。在Stata中,这类似于X^一世

// use a toy data set as example
webuse nlswork

// set up the program including 1st and 2nd stage
program my2sls
    reg grade age race tenure
    predict grade_hat, xb

    probit union grade_hat age race
    drop grade_hat
end

// obtain bootstrapped standard errors
bootstrap, reps(100): my2sls

在此示例中,我们要估计受教育年限对加入工会的可能性的影响。鉴于多年的教育很可能是内生的,因此我们在第一阶段就以多年的任期来衡量它。当然,从解释的角度看这没有任何意义,但是它说明了代码。

只要确保在第一阶段和第二阶段都使用相同的外生控制变量即可。在上面的示例中age, race,(非感性的)仪器tenure仅在第一阶段出现。


非常感谢,这解决了我面临的问题。再次感谢。
维罗妮卡

1
实际上,研究建议对非线性模型(例如logit)使用控制函数方法,该方法将使用第一阶段的残差以及内生变量,而不是预测值。尽管似乎确实经常有所进步,请参见:stat.wharton.upenn.edu/~zijguo/…–
robin.datadrivers

1
抱歉,我没有提供用于比较线性模型和非线性模型的两种方法的引用。ncbi.nlm.nih.gov/pmc/articles/PMC2494557
robin.datadrivers

-1我不得不否决这个答案,因为在第一阶段和/或第二阶段似乎通常无法将2SLS估计器的思想应用于非线性模型。对于第1阶段LS和第2阶段probit的情况可能是正确的(@Andy,您是否有支持这一点的参考?),但至少需要说明一下,因为我已经看到许多人都在进行各种2SLS想法第一阶段和第二阶段的非线性模型的案例,这是有问题的实践。
Momo
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.