什么是工具变量?


36

工具变量在应用经济学和统计学中变得越来越普遍。对于初学者,我们可以对以下问题有一些非技术性的答案:

  1. 什么是工具变量?
  2. 什么时候要使用工具变量?
  3. 如何找到或选择一个工具变量?

4
您认为关于它的Wikipedia文章不够吗?

1
诸如此类的问题需要Wiki /博客文章类型的响应。我确实认为问题不需要这么长的答案。

我不确定正确的做法是简单地忽略此问题,并将问询者转交给Wiki-尤其是在Beta版中,我们试图建立网站的内容。提问者也许应该分别提交每个问题,以便可以更好地解决它们。
russellpierce

3
@mbq-维基百科的示例很难被视为非技术性的。它非常依赖行话和方程式。
rolando2 2011年

1
它在1980年代的某个时候在经济学中变得很普遍。一些生物静电学家也听说过,并将其应用于测量误差模型中,在该模型中,仪器被狭义地视为其他可用测量。它们有资格在更广泛的计量经济学范围内作为工具:它们与关注变量相关,并且与测量误差无关。
StasK,2011年

Answers:


41

[由于使用方程式,以下内容似乎有点技术性,但它主要建立在箭头图上,以提供直觉,只需要对OLS的非常基本的了解即可,因此请不要排斥。

假设您要估计y i的因果效应,由β的估计系数给出,但由于某种原因,您的解释变量与误差项之间存在相关性:xiyiβ

yi=α+βxi+ϵicorr

之所以会发生这种情况,是因为我们忘记了包含一个与相关的重要变量。这个问题被称为遗漏变量偏差,然后你的β不会给你的因果关系(见这里的细节)。当您想使用一种工具时就是这种情况,因为只有这样才能找到真正的因果关系。xiβ^

的仪器是一个新的变量这是不相关的ε ,但良好的相关性与X 和只影响Ÿ 通过X -所以我们的仪器就是所谓的“外源性”。就像这张图在这里:ziϵixiyixi

zixiyiϵi

那么我们如何使用这个新变量呢?
也许您还记得回归背后的ANOVA类型概念,您将因变量的总变异分为解释的和无法解释的部分。例如,如果您将回归到仪器上,xi

xitotal variation=a+πziexplained variation+ηiunexplained variation

zixiziηiϵixi^

xi=a+πzigood variation=x^i+ηibad variation

yi=α+βx^i+ϵi

x^iϵixiηiβxizi

ϵixiyix^i

x^izixiyi

β


ziϵi


10
+1最后,我很高兴阅读详细的答案,而不是参考文献或链接的列表。
ub

1
xϵxxβ

βx^ixixiβ

参见此处:stats.stackexchange.com/questions/64279/…或您可能想问一个新问题。希望这可以帮助。
安迪

@ user35734不一致,但渐近一致。
Vim

17

作为一名没有统计学知识的医学统计学家,我经常要努力掌握工具变量,因为我经常要努力遵循它们的示例,并且不了解它们的术语有很大不同(例如“内生性”,“简化形式”) ','结构方程式','省略变量')。这里有一些我认为有用的参考资料(第一个应该免费提供,但恐怕其他人可能需要订阅):

我还建议以下内容的第4章:



7

非技术性的(通常这就是我所擅长的全部):有时X不仅会导致Y,而且Y也会导致X。工具变量是一种可以“清理”这种凌乱,不便的关系的设备,以便可以对X对Y的影响进行最佳估计。

工具变量是根据其关系来选择的:它是X的原因,但是除了通过X起作用外,它对Y没有任何影响。工具在第一阶段中用于计算新的“版本” ”,它绝不是Y的函数。然后,在更标准的回归分析的第二阶段中使用此新的“预测的” X来解释/预测Y。因此,术语“两阶段最小二乘回归” 。

人们通常会在超越或超出X或Y控制范围的过程中找到IV,例如取决于法律,政策,自然行为等的变量。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.