“内生性”和“外生性”实质上是什么意思?


43

我了解内生性的基本定义 是不满足,但这在现实世界中意味着什么?我阅读了有关供需示例的Wikipedia文章,试图理解这一点,但这并没有真正的帮助。我听说过关于内源性和外源性的其他描述,它们是在系统内部还是在系统外部,对我而言仍然没有意义。

Xϵ=0

1
以下所有三个答案都非常好(每个答案+1)。如果您需要其他信息来源,我将在这里讨论该主题:估计而不是b 1 x 1 + b 2 x 2 + b 3 x 3b1x1+b2x2b1x1+b2x2+b3x3,并通过中的模拟进行说明R
gung-恢复莫妮卡

1
当您具有内生性时,您的回归将不再具有可用的估计量或检验统计量。
伊万

1
我同意@gung的观点,并想强调,完整的答案将涉及“可用于什么目的 ”?上述许多答案都很好地解决了这个问题。
马修·德鲁里

@Matthew在我看来,这篇文章确实试图回答“在现实世界中这意味着什么?”这个问题。很高兴看到解释得到充实,以便人们可以更好地理解它。
ub

@whuber我不知道,它太短了,我真的无法分辨。但是,例如,我在想,即使您具有内生性,估计的模型也可以用于预测(或只是关联),因此,如果没有澄清,“不再有可用的估计器”似乎是错误的。
马修·德鲁里

Answers:


68

JohnRos的答案很好。用简单的英语来说,内生性意味着您弄错了因果关系。您写下并估计的模型无法正确反映因果关系在现实世界中的工作方式。当你写:

Yi=β0+β1Xi+ϵi

您可以通过多种方式来考虑该方程式。您可以将其视为基于的值预测的便捷方法。您可以将其视为对建模的便捷方法。在这两种情况下,都不存在内生性,您无需担心。X E { Y | X }YXE{Y|X}

但是,您也可以将方程式视为因果关系。您可以将视为以下问题的答案:“ 如果我进入该系统并通过实验将增加1 ,将会发生什么?” 如果您想这样考虑,使用OLS进行估算就等于: ÿ Xβ1YX

  1. ÿX导致Y
  2. ÿϵ导致Y
  3. Xϵ不会导致X
  4. XY不会导致X
  5. 不会导致任何原因也导致XϵX

3-5中的任何一个失败通常会导致,或者相当不相等的是。工具变量是一种纠正因果关系错误的事实的方式(通过做出另一个不同的因果假设)。完善进行的随机对照试验是强制 3-5成立的一种方法。如果您随机选择,那么它肯定不是由,或其他任何原因引起的。所谓的“自然实验”方法是尝试在世界上找到3-5成立的特殊情况,即使我们认为3-5通常都不成立。Ç Ò vX ε 0 X ÿ εE{ϵ|X}0Cov(X,ϵ)0XYϵ

在JohnRos的示例中,要计算教育的工资价值,您需要对进行因果解释,但是有充分的理由相信3或5是错误的。β1

但是,您的困惑是可以理解的。在线性模型课程中,非常典型的是,教师使用我上面给出的的因果解释,同时假装不引入因果关系,并假装“都是统计数据”。这是一个怯co的谎言,但也很普遍。 β1

实际上,它是生物医学和社会科学中更大现象的一部分。我们几乎总是试图确定对的因果关系,这毕竟是科学。另一方面,几乎总是有这样的情况,您可以讲一些故事,从而得出结论:3-5中的一个是错误的。因此,存在一种实践的,模糊的,模棱两可的不诚实行为,在这种行为中,我们通过说我们只是在做联想工作,然后将因果解释偷偷带回其他地方(通常在本文的引言和结论部分)来消除异议。ÿXY

如果您真的有兴趣,可以阅读的人是Judea Perl。 詹姆斯·赫克曼也很好。


5
+1很棒的解释和评论。欢迎来到我们的网站!
Whuber

2
您能否说出您推荐的Heckman作品,以获得对这个问题的基本而扎实的理解?
肯尼·路易斯

E[ϵ|X]=0E[ϵX]=0E[ϵ|X]=0E[ϵX]=0ϵ
KevinKim

1
E{ϵ|X}=0ϵE{ϵ|X}=0E{ϵ|X}=0Cov{X,e}=0eE{ϵ|X}=0

2
@KevinKim是的。这不仅仅是线性模型。这都是统计数据。请注意,当有人说“相关性不是因果关系”时,他们永远不会继续告诉您什么因果关系。因果关系是理论,只能是理论。甚至(完全-因此从未进行过的)RCT都不会在没有理论的情况下告诉您因果关系。
Bill

18

让我举一个例子:

假设您想量化教育对收入的(因果)影响。您获取教育年限和收入数据,然后对一个进行回归。您恢复了想要的东西吗?可能不是!这是因为收入也是由教育以外的其他原因引起的,但与教育相关。我们称它们为“技能”:我们可以放心地假设教育年限受“技能”的影响,因为您的技能越高,就越容易获得教育。因此,如果您将教育年限按收入进行回归,则教育效果的估算器会吸收“技能”的影响,并且您会过于乐观地估计教育收益。这就是说,教育对收入的影响(向上)是有偏差的,因为教育不是收入的外生因素。

Cov(X,ϵ)=0


1
感谢您的示例和解释。我对普通英语的内生性和外生性的含义仍然一无所知。当我说一个变量是内生的或关于外生的时,我到底是什么意思。
user25901

@ JohnRos您写了“内生性仅是一个问题,如果您想恢复因果关系”,似乎我也可以这样说:“外生性暗示因果关系”……我从没读过这个短语……但是,对吗?如果是正确的话,在我看来,很多教科书(有时是隐含的)都将因果推理视为正常目标。
markowitz

@markowitz:每当您推断回归系数时,就暗示您需要因果关系。如果只需要预测,则只要预测良好,系数的值就没有关系。的确,古典教科书并没有做出这种区分,因为在预测任务之前不是“基础科学”,而是更多的“工程”(并且请原谅我的粗略概括)
JohnRos

感谢JohnRos,让我问一个有关相关问题的问题。系数的偏估计问题仅在因果回归模型中才有意义,而对于预测目标则绝对没有。这是正确的?我问这是因为这一点在任何地方都不清楚。
markowitz

8

User25901正在寻找直接,简单,真实的解释,这些术语外生和内生的含义。用奥秘的例子或数学定义做出回应并不能真正回答所提出的问题。

我如何对这两个术语有所了解?

这是我想出的:

Exo-外部,外部Endo-内部,内部-内在-起源于

外生的:如果变量不是由模型中的其他参数和变量确定的,而是模型的外生变量,但变量是外部设置的,并且其任何更改都来自外力。

内生的:如果变量至少部分是模型中其他参数和变量的函数,则该变量在模型中是内生的。


7
这些是合理的直观定义,但不必如此无视其他答案。
gung-恢复莫妮卡

3
呼吁词源可以为记住技术术语的含义提供一个有用的句柄(对我来说很奏效),但应避免使用词源它们辩护。只有仔细研究它们的数学定义,才能正确理解几个术语(无论是统计数据还是其他术语)。理解此答案需要对单词和短语的预期用途有一个清晰的概念,例如“由...确定”,“在外部设置”,“更改”,“外部力”和“部分[a]功能”,这些都不是立即可用的。明显的或明确的。
whuber

6

Xϵ=0Xϵ^=0

Y=α+βX+γZ+noiseZXXnoise0ZXlog(ex)=x。这只是一个数学事实。这是省略的变量偏差。

IYXIXXY

那是两个阶段的最小二乘,与IV几乎相同。


据我了解,2SLS并不是IV的一种方法,如果我弄错了,我深表歉意。
user25901

2SLS标准错误是错误的。我忘记了原因或方式,但是如果您搜索“ IV 2SLS标准错误”,您可能会找到一些东西。大多数软件包实现与2SLS的解决(T(Z)%*%(X)%*%T(Z)%*%Y方法
generic_user

1
X^X

谢谢。在撰写本文时,我对应用计量经济学一无所知。
–generic_user

-1

在回归中,我们希望捕获自变量(我们假设是外生的,而不是自身依赖于其他事物)对已确定的因变量的定量影响。我们想知道外生变量对因变量有什么净影响,这意味着自变量应不受其他变量的任何影响。查看回归是否遭受内生性问题的一种快速方法是检查自变量与残差之间的相关性。但这只是一个粗略的检查,否则需要进行内生性的正式测试。


3
这不是真的 根据构造,残差与回归分析的解释变量之间的相关性为零。这不是内生性的测试。
安迪

E[ϵX]=0ϵy=b0+b1x+ϵϵE[e^i|x]=0e^iE[e^i|x]=0b^0+b^1x
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.