为什么因变量中的测量误差不会使结果偏倚?


10

当自变量存在测量误差时,我知道结果将偏向于0。当因变量测量有误差时,他们说这只会影响标准误差,但这对我来说没有多大意义,因为我们估计的影响不是对原始变量的影响,而是对其他一些加上误差的影响。那么这如何不影响估计呢?在这种情况下,我还可以使用工具变量来消除此问题吗?XYY

Answers:


17

当你想估计是一个简单的模型

Yi=α+βXi+ϵi
的真实,而是Yi你只用一些错误观察它Y~i=Yi+νi是这样的,这是不相关与Xϵ,如果你退步
Y~i=α+βXi+ϵi
的估计ββ 因为一个随机变量和一个恒定(之间的协方差α)是零以及之间的协方差Xεν因为我们假设它们是不相关的。
β^=CØvÿ一世X一世V一个[RX一世=CØvÿ一世+ν一世X一世V一个[RX一世=CØvα+βX一世+ϵ一世+ν一世X一世V一个[RX一世=CØvαX一世V一个[RX一世+βCØvX一世X一世V一个[RX一世+CØvϵ一世X一世V一个[RX一世+CØvν一世X一世V一个[RX一世=βV一个[RX一世V一个[RX一世=β
αX一世ϵ一世ν一世

因此,您会看到您的系数是一致估计的。唯一担心的是给你在降低您的统计检验度数误差的附加项。在因变量中出现此类测量错误的非常糟糕的情况下,即使实际上可能存在影响,您也可能找不到明显的影响。通常,工具变量在这种情况下不会为您提供帮助,因为它们比OLS更加不精确,并且只能帮助解释变量中的测量误差。ÿ一世=ÿ一世+ν一世=α+βX一世+ϵ一世+ν一世


我在这里有一个简单的问题:如果νi(即因变量中的测量误差)与相关的自变量相关联,该怎么办?我想这有很多可能性发生,社会可取的偏见就是一个例子。如果受访者在回答因变量问卷时有社会期望偏差,并且如果该期望与自变量有关,那么假设年龄或性别(可以说与社会期望有关),内生性术语呢?
Kang Inkyu

3

回归分析回答了以下问题:“给定X值的人的平均Y值是多少?” 或等效地,“如果我们将X改变一个单位,则Y预测将平均改变多少?” 随机测量误差不会改变变量的平均值或个体子集的平均值,因此因变量中的随机误差不会使回归估计值产生偏差。

假设您有个人样本的身高数据。这些高度被非常精确地测量,准确地反映了每个人的真实身材。在样本中,男性的平均值为175厘米,女性的平均值为162厘米。如果使用回归来计算性别对身高的预测程度,则可以估算模型

HË一世GHŤ=CØñ小号Ť一个ñŤ+βGËñdË[R+[RË小号一世dü一个大号

CØñ小号Ť一个ñŤβGËñdË[RβGËñdË[RGËñdË[Rβ[RË小号一世dü一个大号

ββ

βGËñdË[Rβ

GËñdË[Rβ

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.