有条件分位数回归与无条件分位数回归有什么区别?


38

Koenker和Basset(1978)针对分位数的条件分位数回归估计器定义为 其中\ rho_ \ tau = u_i \ cdot(\ tau-1(u_i <0))是重新加权功能(称为“检查”功能)残差u_iτth

β^QR=minbi=1nρτ(yiXibτ)
ρτ=ui(τ1(ui<0))ui

Firpo等人的论文中(2009年),作者指出条件分位数回归不会产生有趣的效果。他们说,有条件的结果不能推广到总体(在OLS中,我们始终可以通过迭代期望定律从有条件变为无条件,但这不适用于分位数)。这是因为τth无条件分位数yi可能与τth有条件分位数yi|Xi

如果我理解正确,那么问题的一部分就是X_i中包含哪些协Xi变量会对排名变量u_i产生影响,ui因为包含协变量会将误差分为观察到的分量和未观察到的分量。我只是不太明白为什么会引起问题。

这是我的问题:

  1. 是什么使有条件和无条件分位数效应彼此不同?
  2. 如何解释条件分位数回归的系数?
  3. 条件分位数回归是否有偏差?

参考文献:

  • Koenker,R。和Bassett,G。(1978)“回归分位数”,《计量经济学》,第1卷。46(1),第33-50页。
  • Firpo,S。等。(2009)“无条件分位数回归”,《计量经济学》,第1卷。77(3),第953-973页。

1
我建议您查看Angrist和Pischke撰写的“最无害的计量经济学”的第7章。它具有分位数回归系数解释的一些示例,以及分位数对X的影响的示例。我同意您的观点,除非您希望隔离一个协变量的影响,否则这些隐含对于使用模型不会无效。我认为分位数回归也可能有偏差;例如,Angrist和Pischke探索了一些建议的方法来控制遗漏变量。
胡安C

1
不是答案,而是一个线索-分位数回归可以解释为“丢失数据”问题,其中丢失的数据是加权OLS回归中使用的权重。例如,对逆权重使用指数分布可得到中位数回归()。τ=50
概率

Answers:


29

设置
假设您具有以下形式的简单回归: ,其中结果是人对数收入,是受教育的年数,而是错误项。不仅要查看通过OLS获得的教育对收入的平均影响,还希望看到结果分布的不同部分的影响。

lnyi=α+βSi+ϵi
iSiϵi

1)条件设置和无条件设置之间的区别是什么?
首先绘制对数收益,然后让我们选择两个人和,其中在无条件收益分布的下部,而在上部。 ABAB在此处输入图片说明

它看起来不是很正常,但这是因为我在模拟中仅使用了200个观察值,所以不要介意。现在,如果我们将收入作为受教育年限,会发生什么?对于每个层次的教育,您将获得“有条件的”收入分配,即,您将得出上面的密度图,但对于每个层次的教育将分别得出。

在此处输入图片说明

两条深蓝色线是在中位数(下线)和第90个百分位数(上线)处通过线性分位数回归得出的预期收益。受过5年和15年教育的红色密度使您可以估算有条件的收入分配。如您所见,个人受过5年的教育,个人受过15年的教育。显然,个人在接受教育的5年时间里,在他的梨子中做得很好,因此,她处于第90个百分位。ABA

因此,一旦您对另一个变量进行条件确定,现在就会发生一个人现在处于条件分布的顶部,而那个人则处于无条件分布的下部的情况,这改变了分位数回归系数的解释。 。为什么?

您已经说过,使用OLS,我们可以通过应用迭代期望定律从进行转换,但是,这是期望运算符的一个属性,不适用于分位数(不幸的是!)。因此,通常在任何分位数,。这可以通过首先执行条件分位数回归,然后对条件变量进行积分以获得可在OLS中解释的边际效应(无条件效应)来解决。Powell(2014)提供了这种方法的示例。E[yi|Si]=E[yi]Qτ(yi|Si)Qτ(yi)τ

2)如何解释分位数回归系数?
这是棘手的部分,我并不声称拥有世界上有关此方面的所有知识,因此也许有人会对此提出更好的解释。如您所见,无论您考虑条件分配还是无条件分配,个人在收入分配中的排名都可能有很大不同。

对于条件分位数回归
由于您无法确定治疗前后个体在结果分布中的位置,因此只能对整个分布进行声明。例如,在上面的示例中,意味着接受额外的一年教育可以使有条件收入分配的90%的收入增加(但是您不知道谁仍在该分位数中分配给人们一年的教育时间)。这就是为什么通常不将条件分位数估计或条件分位数处理效果视为“有趣”的原因。通常,我们想知道一种治疗如何影响我们身边的人,而不仅仅是分布。β90=0.13

对于无条件分位数回归
这些就像您用来解释的OLS系数。这里的困难不是解释,而是如何获取并不总是那么容易的那些系数(例如,对于非常稀疏的数据,积分可能不起作用)。边缘化分位数回归系数的其他方法也可以使用,例如使用最近影响函数的Firpo(2009)方法。评论中提到的Angrist和Pischke(2009)的书指出,分位数回归系数的边缘化仍然是计量经济学的活跃研究领域-尽管据我所知,当今大多数人都愿意采用积分方法(例如Melly和Santangelo(2015)将其应用于变更中的变更模型)。

3)条件分位数回归系数是否有偏差? 不(假设您使用正确指定的模型),它们只是衡量您可能感兴趣或可能不感兴趣的某些东西。在大多数情况下,对分布而不是对个人的影响估计并不是很有趣。举一个反例:考虑一个制定额外一年义务教育的政策制定者,他们想知道这是否能减少人口中的收入不平等。

前两个面板显示了纯位置偏移,其中在所有分位数上都是常数,即不变的分位数处理效果,这意味着如果,则需要再增加一年在整个收入分配中,教育程度的收入将增加8%。βτβ10=β90=0.8

当分位数处理效果不是恒定的时(如下面两个面板所示),除位置效果外,您还将具有缩放效果。在此示例中,收入分配的底部向上偏移的幅度大于顶部,因此90-10的差异(收入不平等的标准度量)在人口中减少了。 在此处输入图片说明

您不知道哪个人会从中受益,也不知道从底部开始的人是在分配的哪一部分(要回答这个问题,您需要无条件的分位数回归系数)。也许这项政策会伤害他们,并使他们相对于其他人处于更低的地位,但是如果目的是要知道额外一年的义务教育是否会减少收入差距,那么这将是有益的。Brunello等人就是这种方法的一个例子(2009)

如果由于内生性的原因仍然对分位数回归的偏倚感兴趣,请看Angrist等人(2006),他们为分位数上下文导出了省略的变量偏倚公式。


1
当前是否有此技术的R实现?
钱德勒

1

除了@Andy提供的出色答案。您可能要签出:

Borah,BJ,&Basu,A.(2013年)。“通过评估药物依从性的应用,有条件和无条件分位数回归方法之间的突出差异。” 卫生经济学,22(9),1052-1070。http://doi.org/10.1002/hec.2927

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.