我已经读到2SLS估计器即使与二进制内生变量(http://www.stata.com/statalist/archive/2004-07/msg00699.html)仍然保持一致。在第一阶段,将运行概率处理模型,而不是线性模型。
有没有正式的证据表明即使第一阶段是概率模型或对数模型,2SLS仍然是一致的?
如果结果也是二进制,该怎么办?我知道如果我们有二进制结果和二进制内生变量(第一和第二阶段都是二进制概率/逻辑模型),则模仿2SLS方法将产生不一致的估计。是否有任何正式的证据?Wooldridge的计量经济学书进行了一些讨论,但我认为没有严格的证据来证明这种不一致。
data sim;
do i=1 to 500000;
iv=rand("normal",0,1);
x2=rand("normal",0,1);
x3=rand("normal",0,1);
lp=0.5+0.8*iv+0.5*x2-0.2*x3;
T=rand("bernoulli",exp(lp)/(1+exp(lp)));
Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1);
output;
end;
run;
****1st stage: logit model ****;
****get predicted values ****;
proc logistic data=sim descending;
model T=IV;
output out=pred1 pred=p;
run;
****2nd stage: ols model with predicted values****;
proc reg data=pred1;
model y=p;
run;
的系数p = 1.19984
。我只运行一个模拟,但是样本量很大。