回归系数的抽样分布


11

之前,我了解了采样分布,这些分布根据未知参数给出了供估计器使用的结果。例如,对于线性回归模型中和的采样分布β^0β^1Yi=βo+β1Xi+εi

β^0N(β0, σ2(1n+x¯2Sxx))
β^1N(β1, σ2Sxx)

其中Sxx=i=1n(xi2)nx¯2

但是现在我在书中看到了以下内容

假设我们以通常的方式用最小二乘法拟合模型。考虑贝叶斯后验分布,并选择先验,这样就等于通常的常客抽样分布,即……

(β0β1)N2[(β^1β^2), σ^2(ni=1nxii=1nxii=1nxi2)1]

这使我感到困惑,因为:

  1. 为什么估算值出现在前两个表达式的左侧(lhs)和最后一个表达式的右侧(rhs)?
  2. 为什么最后一个表达式中的beta帽子具有1和2下标而不是0和1?
  3. 这些只是同一事物的不同表示吗?如果是的话,有人可以告诉我它们的等效方式吗?如果没有,有人可以解释一下区别吗?
  4. 是否最后一个表达式是前两个表达式的“反转”?这就是为什么最后一个表达式中的2x2矩阵被求逆,并且估计值/参数从rhs lhs 切换吗?如果可以的话,有人可以告诉我如何从一个人到另一个人?

Answers:


7

这部分主要涉及您的第一个,第三个和第四个问题:

贝叶斯统计和常客统计之间有根本的区别。

频率统计通常通过似然来推断哪些固定参数值与被视为随机数据的数据一致。您将(一个或多个参数)设为固定但未知,并查看哪些参数使数据更有可能;它查看给定参数的某个模型的采样属性,以推断出参数可能在哪里。(贝叶斯主义者可能会说,常客主义的做法是基于“未发生的事情的发生频率”)θ

贝叶斯统计根据参数的概率分布来查看参数信息,该概率分布由数据通过可能性更新。参数具有分布,因此您查看。P(θ|x_)

这导致事情看上去通常很相似,但是通过另一种思考方式的角度来看,其中一个变量看起来“走错了方向”。

因此,从根本上说,它们是有所不同的东西,而一个LHS上的东西在另一个RHS上的事实并非偶然。

如果您对两者都做了一些工作,很快就会变得很清楚。

在我看来,第二个问题仅与错字有关。

---

陈述“等于通常的常客抽样分布,即”:我认为这是指作者在说明常客抽样分布。我读错了吗?

发生了两件事-它们有些松散地表达了一些内容(人们一直在表达这种特殊的过度松散的表达),而且我认为您对它的解释也与意图不同。

那么,他们给出的表达到底是什么意思呢?

希望下面的讨论将有助于阐明预期的含义。

如果您可以提供此表达式派生的参考(最好是在线,因为我没有很好的库访问权限),我将不胜感激。

从这里开始:

http://en.wikipedia.org/wiki/Bayesian_linear_regression

通过对采取平坦先验,我认为对也采取平坦先验。βσ2

原因在于,后验由此与似然成正比,并且后验参数所产生的间隔与参数的频繁度置信区间匹配。

您可能会发现这里的前几页也很有帮助。


谢谢,这是有帮助的。我已经做了一些贝叶斯统计。不过,我仍然有些困惑,因为陈述“相当于通常的常客抽样分布,即”:我认为这意味着作者在陈述常客抽样分布。我读错了吗?那么,他们给出的表达到底是什么意思呢?如果您可以提供此表达式派生的参考(最好是在线,因为我没有很好的库访问权限),我将不胜感激。
乔·金

乔-见上文编辑
Glen_b-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.