计量经济学:弹性对我的回归或任何回归有意义吗?


13

几个月前,我在这个组织实习。而且,作为一个远在眼前的礼物,我决定度过我的上周时间,不管我有什么休息时间,都去调查影响教师工资的因素。我遇到的教师工资问题是给定州的分配不当。我有很多观察结果都紧贴工资水平的低端。我试图通过将可比工资指数纳入因变量(教师工资)来解决此问题,但发现的结果与我的项目范围完全不符。相反,我决定记录我的因变量。很好,因为现在我的工资呈正态分布,并且在直方图中看起来很完美。当我开始测试时,我到了最后一个独立变量,即财产税申报单。我的固定工资问题在我的财产税申报表中也很明显。我的财产税报税表偏向低端。因此,我也记录了该变量,它仍然通过了原假设检验。

我不确定这是否正确,但是通过比较一个记录变量与另一个记录变量的变化,可以得出弹性。假设这是正确的,我的回归方程(类似于LogWages = B0 + B1(LogPropertyTaxReturns))显示了两个变量之间的弹性。这有意义吗?如果我的目标是了解在我州的任何给定县中哪个变量对教师工资的影响最大,那么表明这两个变量之间的弹性是否有帮助?我们希望将教师工资最低的县提高到更高的水平,以提高他们的生活水平,但是我担心我的推断离实际观察结果还差得很远,因此我的结论回归方程毫无意义。

编辑:我最大的担心之一是我应该使用非线性模型来显示关系。我觉得在这种线性回归中强迫因变量和自变量共同起作用在某种程度上是一种误导。


1
这绝对是有意义的。看一下弹性的定义。您基本上可以获得有关工资和PropertyTaxReturns之间关系的方向的信息。此外,您可以估算出该关系。由于它是对数对数,因此薪水将每变化百分之一的物业税,将B1%的变化。您可以对此进行时间序列分析以确认这一点。实际上,仅绘制一段时间内的工资和财产税申报表就足以了解两者之间的关系。那是不占隐变量等基本方式
科巴

@Koba感谢您这么快发表评论。尽管弹性会沿着曲线变化,这不是问题吗?我最大的遗憾是我可能迫使模型线性化,迫使弹性相当稳定。回想起来,实际上最好有一个非线性模型来反映我在说的这种偏斜。
rosenjcb 2014年

使用对数,平方根,倒数或其他方法转换变量没有错。您没有强迫任何事情。您可以使用转换来找到变量之间的线性关系。有时就像使用y = b0 + b1 * x一样容易。其他时间变量以更复杂的方式线性相关,例如log(y)= b0 + b1 *(1 / x)。最后一个函数可能会为您提供良好的线性关系,但很难解释,因此可以使用的转换越少越好。
科巴2014年

log-log函数非常简单,log(y)= b0 + b1 * log(x)。B1恰好是横截面分析中x的每百分之一的y的百分比变化。同样,如果您在一段时间内拥有此数据,则可以将其制成图表以查看其关系。
科巴2014年

我之前已经记录了变量,并为回归模型进行了其他转换。我只是担心弹性会假装开会。尽管回想起来,该模型是线性的,但它只存在具有偏态分布的因变量和自变量的问题。
rosenjcb 2014年

Answers:


12

这个问题的答案是肯定的,它的确有意义(至少从数学上来说)。如果您估算线性方程

w ^=β0+β1个PŤ[R

然后,这意味着β1表示的边际变化PŤř超过w ^。现在,如果您估计β1个=w ^PŤ[Rβ1个PŤ[Rw ^

ØGw ^=β0+β1个ØGPŤ[R

然后是弹性的定义。β1个=w ^PŤ[RPŤ[Rw ^

一般而言,线性变换只会影响对系数的解释,而回归本身的有效性(从广义的经济学角度而言)则由模型的假设和所分析的经济现象给出。


8

就像人们在评论中所说的那样,log-log是常用的。它相当于估计的恒定弹性模型,这是经济学中通常使用的功能形式。一旦你把日志,这成为 LN Ÿ = LN α + β LN X。您可以在此处了解更多信息。ÿ=αXβlnÿ=lnα+βlnX

我想您的问题是,在您的特定模型中使用此功能形式是否有意义。很难说。与任何普通的线性回归一样,您正在假设函数形式。您至少可以将其视为线性对数,在对数-对数转换后更有意义。


7

XαβF

日志ÿ一世=α+β日志X一世+Ĵ=2小号γĴχĴ+λĴχĴ日志X一世
χĴγλ

注意,作为“真实”基础决策的表示,导致线性回归的所有转换都是错误的。实际上,所有模型都会出错。问题确实是:您从此模型获得的统计信息对您的问题有用吗?如果您的研究专注于确定基础模型,那么此刻是否可以告诉您有关更深层模型的一些有趣信息?如果您更注重政策,那么具有恒定弹性的近似值将使您足够接近于进一步改进无关紧要的事实吗?作为外部观察者,这两个问题都非常难以回答。但是,如果您担心的唯一选择是可变弹性,那么我上面概述的那种测试可能会让您省心。


4

其他答案涵盖了主要问题,我想回答OP在问题中所做的“编辑”:

编辑:我最大的担心之一是我应该使用非线性模型来显示关系。我觉得在这种线性回归中强迫因变量和自变量共同起作用在某种程度上是一种误导。

我们倾向于忘记“转换变量” 会导致一个新变量,其行为可能与“原始变量” 完全不同。最简单的示例是比较变量的图形及其平方。

因此,通过考虑变量的自然对数,您不再需要检查它们之间关系,而是要检查它们的某些功能之间关系。 这是幸运的是,“对数”数学概念可以链接到“弹性”,它描述的百分比变化之间的关系,这是我们从经济角度看不懂的东西的概念,我们可以有意识解释和使用。

如果可以合理地认为变量表现出“对数线性关系”,则意味着它们的级别(即实际变量)具有非线性关系:

lnÿ一种+blnXÿË一种+Xb

那么,为什么不估计一个非线性模型呢?
根据(数学)原理,没有理由不这样做。一些实际问题是:

1)非线性关系的形式太多,只有一种线性关系(从结构上来说)。对于最合适的规格,这是“搜索成本”的问题。

2)获得的非线性关系可能没有明确的经济解释。为什么这是一个问题?因为,我们并没有在这里发现时空的“自然法则”。我们正在逼近一种社会现象。此外,只有一个近似值只能作为一个数学公式来表示,而没有经济的理由来验证和支持该近似值,因此得出的结果很薄。

3)就估算算法的机制而言,非线性估算的稳定性较差。


3

我想说的是,如果您的目标是查看在我州任何给定县中哪个变量对教师工资影响最大 ”,那么在这种情况下,您的模型就没有意义。您刚刚显示了工资和财产税报酬(的对数)之间的相关性。您至少应使用多元回归。

当然,您可以继续前进,并使用适当的方法论工具来开发成熟,适当的识别策略,以便估算每种因果效应的强度并找到最大的因果关系……实际上,您很可能将无法考虑到这种任务的复杂性,可以做到这一点。这只是一个不断完善的过程,并且您接近用来解释工资的最粗略的模型,与我认为对目标中隐含问题的答案的可接受近似值相差很远。您应该尝试争取计量经济学家的帮助。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.