设置
假设您具有以下形式的简单回归:
,其中结果是人对数收入,是受教育的年数,而是错误项。不仅要查看通过OLS获得的教育对收入的平均影响,还希望看到结果分布的不同部分的影响。
lnyi=α+βSi+ϵi
iSiϵi
1)条件设置和无条件设置之间的区别是什么?
首先绘制对数收益,然后让我们选择两个人和,其中在无条件收益分布的下部,而在上部。
ABAB
它看起来不是很正常,但这是因为我在模拟中仅使用了200个观察值,所以不要介意。现在,如果我们将收入作为受教育年限,会发生什么?对于每个层次的教育,您将获得“有条件的”收入分配,即,您将得出上面的密度图,但对于每个层次的教育将分别得出。
两条深蓝色线是在中位数(下线)和第90个百分位数(上线)处通过线性分位数回归得出的预期收益。受过5年和15年教育的红色密度使您可以估算有条件的收入分配。如您所见,个人受过5年的教育,个人受过15年的教育。显然,个人在接受教育的5年时间里,在他的梨子中做得很好,因此,她处于第90个百分位。ABA
因此,一旦您对另一个变量进行条件确定,现在就会发生一个人现在处于条件分布的顶部,而那个人则处于无条件分布的下部的情况,这改变了分位数回归系数的解释。 。为什么?
您已经说过,使用OLS,我们可以通过应用迭代期望定律从进行转换,但是,这是期望运算符的一个属性,不适用于分位数(不幸的是!)。因此,通常在任何分位数,。这可以通过首先执行条件分位数回归,然后对条件变量进行积分以获得可在OLS中解释的边际效应(无条件效应)来解决。Powell(2014)提供了这种方法的示例。E[yi|Si]=E[yi]Qτ(yi|Si)≠Qτ(yi)τ
2)如何解释分位数回归系数?
这是棘手的部分,我并不声称拥有世界上有关此方面的所有知识,因此也许有人会对此提出更好的解释。如您所见,无论您考虑条件分配还是无条件分配,个人在收入分配中的排名都可能有很大不同。
对于条件分位数回归
由于您无法确定治疗前后个体在结果分布中的位置,因此只能对整个分布进行声明。例如,在上面的示例中,意味着接受额外的一年教育可以使有条件收入分配的90%的收入增加(但是您不知道谁仍在该分位数中分配给人们一年的教育时间)。这就是为什么通常不将条件分位数估计或条件分位数处理效果视为“有趣”的原因。通常,我们想知道一种治疗如何影响我们身边的人,而不仅仅是分布。β90=0.13
对于无条件分位数回归
这些就像您用来解释的OLS系数。这里的困难不是解释,而是如何获取并不总是那么容易的那些系数(例如,对于非常稀疏的数据,积分可能不起作用)。边缘化分位数回归系数的其他方法也可以使用,例如使用最近影响函数的Firpo(2009)方法。评论中提到的Angrist和Pischke(2009)的书指出,分位数回归系数的边缘化仍然是计量经济学的活跃研究领域-尽管据我所知,当今大多数人都愿意采用积分方法(例如Melly和Santangelo(2015)将其应用于变更中的变更模型)。
3)条件分位数回归系数是否有偏差?
不(假设您使用正确指定的模型),它们只是衡量您可能感兴趣或可能不感兴趣的某些东西。在大多数情况下,对分布而不是对个人的影响估计并不是很有趣。举一个反例:考虑一个制定额外一年义务教育的政策制定者,他们想知道这是否能减少人口中的收入不平等。
前两个面板显示了纯位置偏移,其中在所有分位数上都是常数,即不变的分位数处理效果,这意味着如果,则需要再增加一年在整个收入分配中,教育程度的收入将增加8%。βτβ10=β90=0.8
当分位数处理效果不是恒定的时(如下面两个面板所示),除位置效果外,您还将具有缩放效果。在此示例中,收入分配的底部向上偏移的幅度大于顶部,因此90-10的差异(收入不平等的标准度量)在人口中减少了。
您不知道哪个人会从中受益,也不知道从底部开始的人是在分配的哪一部分(要回答这个问题,您需要无条件的分位数回归系数)。也许这项政策会伤害他们,并使他们相对于其他人处于更低的地位,但是如果目的是要知道额外一年的义务教育是否会减少收入差距,那么这将是有益的。Brunello等人就是这种方法的一个例子。(2009)。
如果由于内生性的原因仍然对分位数回归的偏倚感兴趣,请看Angrist等人(2006),他们为分位数上下文导出了省略的变量偏倚公式。