贝叶斯如何比较分布?


25

因此,我认为我对频繁出现概率和统计分析的基础知识(以及使用它的严重程度)有很好的了解。在一个频繁论者的世界中,提出这样的问题是有意义的:“此分布是否不同于该分布”,因为假定分布是真实的,客观的且不变的(至少对于给定的情况而言),因此我们可以得出从一个形状像另一个样本的分布中抽取一个样本的可能性有多大。

在贝叶斯世界观中,考虑到我们过去的经验,我们只关心我们期望看到的结果(在这一部分上我仍然有点含糊,但是我理解贝叶斯更新的概念)。如果是这样,贝叶斯怎么能说“这组数据与那组数据不同”?

出于这个问题的目的,我不在乎统计意义或类似意义,而只是在乎如何量化差异。我同样对参数和非参数分布感兴趣。


您能否阐明“这组数据与那组数据不同”的含义?就像在中,您是指两个或多个组的比较,例如男性收入与女性收入的比较吗?也许贝叶斯如何在不了解性别的情况下比较两个收入样本?
ramhiser

2
@ JohnA.Ramey:有什么区别?一旦数字全部确定,难道“男”和“女”不只是样本标签吗?
naught101

Answers:


13

将您的陈述视为常客,首先使其更加具体。常问的人没有进一步说明就不能说“数据集A与数据集B不同”。

首先,您必须声明“不同”的含义。也许您的意思是“具有不同的平均值”。再说一遍,您可能意味着“具有不同的差异”。还是别的?

然后,您必须说明要使用哪种测试,这取决于您认为对数据的有效假设。您是否假设数据集在某种程度上都是正态分布的?还是您认为它们都是Beta发行版?或者是其他东西?

现在您是否可以看到第二个决策与贝叶斯统计中的先验非常相似?这不仅是“我过去的经验”,而是我相信以及我的同龄人会相信的,是对我的数据的合理假设。(贝叶斯算法可以使用统一的先验,这将事情推向了频繁计算。)

编辑:回应您的评论:下一步包含在我提到的第一个决定中。如果要确定两组均值是否不同,则可以在一定的置信度下查看两组均值差的分布,以查看此分布是否包含零。您究竟算得上接近零的程度为零,并且使用的(后验)分布的确切部分取决于您和您所需要的置信度。

在Kruschke的论文中可以找到关于这些想法的讨论,他还写了一本非常易读的书《做贝叶斯数据分析》,其中涵盖了第307-309页的示例“不同的群体是否相等?”。(第二版:第468-472页。)他还对此问题发表博客文章,并进行了一些问答。

进一步编辑:您对贝叶斯过程的描述也不是很正确。根据我们独立于数据而了解的信息,贝叶斯主义者只关心数据告诉我们的内容。(正如Kruschke所指出的,先验不一定发生在数据之前。这就是这个短语的含义,但这实际上只是我们的知识,不包括某些数据。)我们独立于特定数据集所知的内容可能是含糊的或特定的并且可能基于共识,基础数据生成过程的模型,也可能只是其他(不一定是先前的)实验的结果。


是的,好的,常客会分配,这是主观的。但是随后他们可以测量每个样本的参数,并带有误差,然后说:“好吧,这些是每个样本的真实总体的参数,现在,差异是由于采样误差引起的概率是多少”。我的问题是回答之后的步骤-贝叶斯如何推断样本之间的差异(假设样本来自相同类型的分布,是否为参数)。
naught101

@ naught101:请看我的编辑。
韦恩(Wayne)

@Wayne您链接的论文非常好。感谢您的分享
Cam.Davidson.Pilon 2013年

@ naught101:我已经更新了博客链接。显然,他保留了较旧的文章版本,每个链接都链接到较新的版本,而我首先链接到的是三个版本已过时。
韦恩(Wayne)

这是一个很酷的方法,并且确实弄清楚了贝叶斯推理如何工作(通过将分布参数视为不确定性的来源)。可惜它的计算量很大。另外,使用95%CI似乎有点像设置显着性水平,但是我看不出是否有一种真正的方法来获得可报告的p值等效值(也许值的概率之和更多)。均值是否大于0,是否为均值之差?)。
naught101

14

本文可能会引起您的兴趣:http : //arxiv.org/pdf/0906.4032v1.pdf

它很好地总结了一些常见问题和贝叶斯方法来解决这两个样本问题,并讨论了参数和非参数情况。

它可能会在其他答案中添加一些内容,以举一个简单的例子。假设您有两个数据集和,其中每个和每个均为或。在两种情况下都假设一个iid Bernoulli模型,因此每个和每个 。你的假设在测试场景在频率论者和贝叶斯设置可以是:ÿ X ý Ĵ 0 1 X Ë ř Ñ p ÿ Ë ř Ñ q XÿX一世ÿĴ01个X一世Ë[Rñpÿ一世Ë[Rñq

H0p=q

H1个pq不一定相等。

在每种情况下,数据的可能性为:

在:H0L0(p)=f(x,y;p)=一世p一世1个-p1个-一世ĴpĴ1个-p1个-Ĵ

L 1p q = f xy ; p q = i p i1 p 1 ij q j1 q 1 jH1个L1(p,q)=f(x,y;p,q)=ipi(1p)1ijqj(1q)1j

(由于)。解决该问题的常用方法可能是进行似然比检验,从而计算统计量:H0q=p

W=2log{L0(pmax)L1(pmax,qmax)}

其中分别表示为最大似然估计pq有关假设下(因此p 一个X在分子可能不一样p 一个X在分母)。 w ^渐近服从χ 2 1分配(例如参见Pawitan,2001),所以你会指定一个显着性水平和拒绝/不拒绝^ h 0为合适。pmax,qmaxpqpmaxpmaxWχ12H0

传统上,在贝叶斯方法中,检验统计量将是贝叶斯因子。首先,你将承担一些相关的先验概率^ h 0p q π 1^ h 1。贝叶斯因子是边际可能性的比率,由下式给出:pπ0H0p,qπ1H1

BF=f(x,y|H0)f(x,y|H1)=01L0(p)π0(p)dp0101L1(p,q)π1(p,q)dpdq

H0H1H0H1 p(H0)=p(H1)=1/2

pH0|XÿpH1个|Xÿ=F×pH0pH1个=F×1个/21个/2=F

>1个H0H1个H0

H1个

希望能对已经发布的其他答案有所帮助。


0

在给定数据的情况下,我们有多强的信念认为两组不是来自同一人口(H_1:他们不是来自同一人口,而H_0:他们是来自同一人口)。这可以通过贝叶斯t检验来完成。

复杂度用于计算先验与一个假设的重叠程度。拟合用于计算后验与一个假设的重叠程度。综合起来,您可以比较这些假设并表达对这些假设是否来自同一人群的后信。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.