为什么有必要将分布假设置于误差上,即
,具有 ε 我〜Ñ(0 ,σ 2)。
为什么不写
,与 ÿ 我〜Ñ(X β,σ 2),
其中在任一情况下。 我已经看到它强调指出分布假设是基于错误而不是数据,但没有解释。
我不太了解这两种说法之间的区别。在某些地方,我看到分布假设被放置在数据上(贝叶斯照明。它似乎主要是),但是大多数情况下,假设被放置在错误上。
在建模时,为什么/应该选择一个假设还是另一个假设开始?
首先,它不是“必需的”,它取决于您打算做什么。有一些很好的答案,但是我认为症结在于因果关系的基本假设,就X而言,x会“造成” y,如果您这样看,您会发现y的分布是由“造成”的rhs的分布,即Xs和错误(如果有)。您可以在非常有限的分布假设下进行大量的计量经济学工作,尤其是没有正态性的情况下。感谢上帝。
—
PatrickT 2014年
不是Xβ,和人口平均ÿ的是不一样的它的样本估计。这是说,第二件事情是不实际的事情是一样的,但是,如果你与它的期望取代它(ē( Ÿ)=Ë(Ÿ)=Xβ),这两个是等价的。
—
Glen_b-恢复莫妮卡2014年
什么是ÿ?如果Ÿ 我便随着我,为什么不X β变化?请确定要使用哪种表示法,向量或矩阵。现在,如果我们假定Ŷ = X β的符号是大于的bizzare:ÿ 我〜Ñ (X ' 我(Σ X Ĵ X ' Ĵ)- 1 Σ X Ĵ ÿ Ĵ,σ 2),即您根据本身和所有其他观测值y j定义y i的分布!
—
mpiktas 2014年
我否决了这个问题,因为我认为这种表示法令人困惑,这已经导致了一些微妙的矛盾答案。
—
mpiktas 2014年