2SLS与二元内生变量的一致性

我已经读到2SLS估计器即使与二进制内生变量（http://www.stata.com/statalist/archive/2004-07/msg00699.html）仍然保持一致。在第一阶段，将运行概率处理模型，而不是线性模型。

有没有正式的证据表明即使第一阶段是概率模型或对数模型，2SLS仍然是一致的？

如果结果也是二进制，该怎么办？我知道如果我们有二进制结果和二进制内生变量（第一和第二阶段都是二进制概率/逻辑模型），则模仿2SLS方法将产生不一致的估计。是否有任何正式的证据？Wooldridge的计量经济学书进行了一些讨论，但我认为没有严格的证据来证明这种不一致。

data sim;
     do i=1 to 500000;
        iv=rand("normal",0,1);
             x2=rand("normal",0,1);
        x3=rand("normal",0,1);
        lp=0.5+0.8*iv+0.5*x2-0.2*x3;
        T=rand("bernoulli",exp(lp)/(1+exp(lp)));
        Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1);
        output;
     end;
     run;

****1st stage: logit model ****;
****get predicted values   ****;         
proc logistic data=sim descending;
     model T=IV;
     output out=pred1 pred=p;
     run;

****2nd stage: ols model with predicted values****;
proc reg data=pred1;
     model y=p;
     run;

的系数p = 1.19984。我只运行一个模拟，但是样本量很大。

probit instrumental-variables endogeneity

— 文森特
source

您是否不需要在模型语句中添加link = probit？

— Mike Hunter

关于概率第一阶段和OLS第二阶段也存在类似的问题。在答案中，我提供了指向注释的链接，这些注释包含对此回归的不一致性的正式证明，这被正式称为“禁止回归”，如杰里·豪斯曼（Jerry Hausman）所称。概率第一阶段/ OLS第二阶段方法不一致的主要原因是，期望运算符和线性投影运算符均未通过非线性第一阶段。因此，在非常严格的假设（几乎在实践中几乎不成立）下，第一阶段概率的拟合值仅与第二阶段误差项不相关。但是请注意，如果我没记错的话，禁止回归的不一致的形式证明非常详尽。

ÿ_{一世} = α + β X_{一世} + ϵ_{一世}

$Y_i = \alpha + \beta X_i + \epsilon_i$

Y_{i}

$Y_i$

X_{i}

$X_i$

X_{一世} = 一个 + ž_{一世}^{'} π + η_{一世}

$X_i = a + Z'_i\pi + \eta_i$

{\hat{X}}_{i}

$\widehat{X}_i$

X_{i}

$X_i$

X_{i}

$X_i$

$Y_i$

要对此进行更详细的讨论，请查看Kit Baum 关于该主题的出色讲义。他在幻灯片7中讨论了2SLS上下文中线性概率模型的使用。

最后，如果您确实想使用概率，因为您想要更有效的估计，那么Wooldridge（2010）“横截面和面板数据的计量分析”中也提到了另一种方法。上面链接的答案包括它，为完整起见，在此重复。作为应用示例，请参见Adams等。（2009）使用三步过程进行如下操作：

使用概率回归工具上的内生变量和外生变量
将OLS第一步中前一步的预测值与外生变量（但无工具变量）一起使用
照常做第二阶段

此过程不属于禁止回归问题，但可能会更有效地估计您感兴趣的参数。

— 安迪
source

嗨，安迪，感谢您的回复。您是否建议“概率第一阶段/ OLS第二阶段方法不一致”？那不是我在链接中看到的内容。据说Probit第一阶段/ OLS第二阶段方法是一致的。

— 文森特

那不是Statalist帖子所说的。如果您在文档中查看treatreg命令（现在称为etregress）的“方法和公式”部分，您将看到两步估算器不是带有Probit第一阶段/ OLS第二阶段的2SLS。取而代之的是，首先使用概率来获得风险比，然后将其用于OLS回归以获得一致的估计。

— 安迪

谢谢，安迪。越来越有趣了。在第一阶段，它看起来像与Probit模型的2SLS不被接受。由于种种原因，我将通读“禁止回归”。顺便说一句，我尝试了使用SAS进行的模拟，结果对于Probit 1st / ols 2nd的2SLS来说看起来不错。

— 文森特2014年

我正在主要问题中发布代码，很想听听您的意见。谢谢！

— 文森特