刚刚确定的2SLS中位数是无偏的吗?


13

在《最无害的计量经济学:经验主义者的同伴》中(Angrist and Pischke,2009:第209页),我读到以下内容:

(...)实际上,刚刚确定的2SLS(即简单的Wald估计量)几乎是无偏的。这很难正式显示,因为刚刚确定的2SLS没有任何时刻(即,采样分布有粗尾)。但是,即使仪器较弱,刚刚确定的2SLS也会大致居中。因此,我们说刚刚确定的2SLS是中值无偏的。(...)

虽然作者是刚刚确定的2SLS是中位数,不带偏见,他们既没有证实,也没有提供一个参考的证据。他们在第213页再次提到了该命题,但没有提及证明。另外,我在麻省理工学院第22页的关于工具变量讲义中找不到提出这一主张的动机。

原因可能是该提议是错误的,因为他们在博客的注释中拒绝了该提议。但是,他们写道,刚刚确定的2SLS 近似为中值。他们使用一个小型的蒙特卡洛实验来激发这一点,但没有提供分析证明或与近似值相关的误差项的封闭式表达。无论如何,这是作者对密歇根州立大学教授Gary Solon的答复,他评论说刚刚确定的2SLS 并非中性的。

问题1:如何证明刚刚确定的2SLS 并不像Gary Solon所说的那样是中性的?

问题2:如Angrist和Pischke所论,您如何证明刚刚确定的2SLS 近似中值无偏?

对于问题1,我正在寻找一个反例。对于问题2,我(主要)是在寻找证明或参考证明。

在这种情况下,我也在寻找中值无偏差的正式定义。我理解这个概念如下:估计器θX 1 Ñθ基于某些设定的X 1 ñÑ随机变量是中值无偏为θ当且仅当的分布θX 1 n具有中值θθ^(X1:n)θX1:nnθθ^(X1:n)θ


笔记

  1. 在刚刚确定的模型中,内生回归变量的数量等于工具数量。

  2. (1){Y=Xβ+Wγ+uX=Zδ+Wζ+v
    Xk×n+1kk×n+1ZWuv
  3. β(1)XZWX^YX^WX^β

  4. yi=α+βxi+ui
    xiziβ
    (2)β^2SLS=sZYsZX,
    sABAB(2)
    (3)β^2SLS=i(yiy¯)zii(xix¯)zi=β+i(uiu¯)zii(xix¯)zi
    y¯=iyi/nx¯=ixi/nu¯=iui/nn
  5. 我进行了文献搜索,使用“正当识别”和“中位数无偏”一词来查找回答问题1和2的参考文献(请参见上文)。我什么都没找到。我发现(见下文)的所有文章都提到Angrist和Pischke(2009:第209、213页)时指出刚确定的2SLS是中值无偏的。

    • Jakiela,P.,Miguel,E.,&Te Velde,VL(2015)。您已经赢得了它:估算人力资本对社会偏好的影响。实验经济学,18(3),385-407。
    • An,W.(2015年)。工具变量估计社交网络中的对等效应。社会科学研究,50,382-394。
    • Vermeulen,W.和Van Ommeren,J.(2009)。土地利用规划会影响区域经济吗?同时分析了荷兰的住房供应,内部移民和当地就业增长。住房经济学杂志,18(4),294-310。
    • Aidt,TS,&Leon,G.(2016年)。民主的机会之窗:撒哈拉以南非洲骚乱的证据。冲突解决杂志,60(4),694-717。

2
我无法用正式的证据来回答这个问题,而是通过一些模拟研究来表明LIML是无偏中值(加上定义),并且具有一个内生变量和一个仪器的LIML和2SLS具有相同的小样本分布(因此,如果LIML在这种情况下情况是中值无偏的,那么2SLS也是如此。这足以回答您的问题吗?
安迪

@Andy那将是一个非常不错的答案!可能就足够了,这取决于其他用户可能会说些什么。大概就足够了,因为我认为没有证据表明刚刚确定的2SLS近似为中值。一个反例很好,它表明刚刚确定的2SLS并不是中值无偏的。但我认为自己有可能(但可能很难)提出反例。
伊莱亚斯(Elias)

近似无偏,您是说偏倚随观察次数的多少而变为零,例如1 / n或1 / n ^ 2等?
伊戈尔(Igor)

@Igor我没有使用短语“大约中值无偏”。由于我不知道“中位数无偏见”的正式含义,所以我无法回答您的问题。但是,您似乎在想的是一个估计器,它渐近无偏。
伊莱亚斯

Answers:


6

在模拟研究中,中值偏差是指估算器与其真实值之间的偏差的绝对值(在本例中您会知道,因为这是模拟,因此您选择真实值)。您可以看到Young(2017)的工作论文在表15中定义了这样的中位数偏差,或者Andrews和Armstrong(2016)在图2中绘制了不同估计量的中位数偏差图。

造成混淆的部分原因(也在文献中)似乎来自以下事实:存在两个单独的潜在问题:

  1. 弱仪器
  2. 许多(潜在)较弱的工具

在刚刚确定的环境中拥有较弱工具的问题与拥有许多较弱工具的情况大不相同,但是,这两个问题有时会融合在一起。

κ

β^=[X(IκMZ)X]1[X(IκMZ)y)]

MZ=IZ(ZZ)1Z

y=Xβ+uX=Zπ+e.

κκ=0κ=1κdet(XXκXMZX))=0

渐近地,LIML和2SLS具有相同的分布,但是,在小样本中,这可能非常不同。当我们拥有许多工具且其中一些工具较弱时,尤其如此。在这种情况下,LIML的性能优于2SLS。LIML此处显示为中值无偏。该结果来自大量仿真研究。通常,陈述该结果的论文参考Rothberg(1983)“结构模型中某些估计量的渐近性质”,Sawa(1972)Anderson等。(1982)

Steve Pischke 在幻灯片17的2016年笔记中对此结果进行了模拟,显示了OLS,LIML和2SLS的分布以及20种工具,其中只有一种是有用的。真实系数值为1。您会看到LIML以真实值为中心,而2SLS偏向OLS。 在此处输入图片说明

现在,论点似乎如下:假设LIML可以证明是无偏的中值,并且在刚刚确定的情况(一个内生变量,一种工具)中,LIML和2SLS是等效的,因此2SLS也必须是无偏中值。

但是,似乎人们再次混淆了“弱工具”和“许多弱工具”的情况,因为在刚刚确定的设置中,当工具弱时,LIML和2SLS都会有偏差。我还没有看到任何结果能证明LIML在工具薄弱且刚刚确定的情况下没有偏见,而且我认为这不是真的。Angrist和Pischke(2009)在第2页上对Gary Solo的回应中得出了类似的结论,他们在改变仪器强度时模拟了OLS,2SLS和LIML的偏差。 在此处输入图片说明

对于小于0.1的非常小的第一级系数(保持标准误差固定),即仪器强度低,刚确定的2SLS(因此刚确定的LIML)与OLS估计器的概率极限相比,更接近于真实系数值为1。

一旦第一阶段系数在0.1到0.2之间,他们注意到第一阶段F统计量大于10,因此根据Stock and Yogo(2005)的F> 10的经验法则,不再存在弱工具问题。从这个意义上讲,我看不到在刚刚确定的情况下,LIML应该如何解决弱仪器问题。还要注意,i)LIML趋于分散,需要校正其标准误差(请参阅Bekker,1994年); ii)如果您的仪器实际上很弱,那么无论是使用2SLS还是LIML都不会在第二阶段找到任何东西因为标准误差会太大。


谢谢你的回答!这使我更清楚了一切。
Elias
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.