beta分布从何而来?


13

我确定这里的每个人都已经知道,Beta分布的PDF 由XB(a,b)

f(x)=1B(a,b)xa1(1x)b1

我一直在各地寻找有关该公式起源的解释,但我找不到它。我在Beta发行版上找到的每篇文章似乎都给出了这个公式,说明了它的一些形状,然后直接讨论其关键时刻。

我不喜欢使用无法推导和解释的数学公式。对于其他分布(例如伽马或二项式),有一个明确的推导可以学习和使用。但是我找不到类似的东西用于Beta发行版。

所以我的问题是:该公式的起源是什么?在最初开发的任何上下文中,如何从第一性原理中衍生出来?

[为澄清起见,我不是在问如何在贝叶斯统计中使用Beta分布,或者在实践中直觉地意味着什么(我已经读过棒球示例)。我只想知道如何导出PDF。以前有一个问题提出了类似的问题,但是(我认为是错误的)它被标记为另一个未解决该问题的问题的重复,因此到目前为止,我在这里找不到任何帮助。]

编辑2017-05-06:谢谢大家的提问。我想对我想要的东西有一个很好的解释,当我向一些课程讲师问这个问题时,我得到了以下答案之一:

“我想人们可以将正常密度推导为n个事物的总和除以sqrt(n)的极限,并且可以从事件以恒定速率发生的想法推导泊松密度。类似地,为了推导Beta密度,您将需要某种概念来确定什么使得Beta分布独立于密度,并且在逻辑上先于密度。”

因此,注释中的“从头开始”的想法可能最接近我要寻找的想法。我不是数学家,但是我使用能够推导的数学感到最自在。如果起源对我来说太先进了,那就去吧,但是如果不是,我想了解它们。


5
源自什么?如果二项式共轭先验方法是不可接受的,则这里有几种选择(例如统一随机变量的顺序统计,伽玛变量的比例)。
GeoMatt22年

3
注意:Beta发行版的全部历史记录都在该发行版上令人难以置信的Wikipedia页面中提供,其中包含几乎所有可能的细节!
西安

1
以前的问题被标记为重复其他后OP澄清了他们的意见后。Whuber在这里问了一个与@ Geomatt22相同的问题:“ 派生表示从假定的事物到要建立的事物的逻辑连接。您要假设什么?”
Scortchi-恢复莫妮卡

2
@Aksakal,但问题太广泛了-它可能以各种方式派生;如果您是正确的话,我将其关闭得太宽,直到问题被缩小到足以使之成为可能的答案之外的其他内容
Glen_b -Reinstate Monica

3
这里是对一些历史背景的简短讨论(至少就其与不完整的beta功能的关系而言)。它与伽马分布以及许多其他分布有联系,并且以多种不同方式相当合理地出现。正如西安指出的那样,皮尔逊体系也有其历史渊源。您在这里寻求什么样的答案?给出什么/必须得出什么?
Glen_b-恢复莫妮卡

Answers:


6

作为前物理学家,我可以看到它是如何产生的。这是物理学家的工作方式:

当他们遇到一个正函数的有限积分时,例如beta函数: 他们本能地定义密度: 其中f s | x y = s x 11 s y 1

B(x,y)=01tx1(1t)y1dt
0<s<1
f(s|x,y)=sx1(1s)y101tx1(1t)y1dt=sx1(1s)y1B(x,y),
0<s<1

他们经常对各种积分执行此操作,以至于它不需思考就反省地发生。他们称此过程为“规范化”或类似名称。请注意,从定义上讲,密度是如何简单地具有您希望它具有的所有属性的,例如始终为正并加一。

我上面给出的密度具有Beta分布。f(t)

更新

@whuber在问,关于Beta分布有什么特别之处,而上述逻辑可以应用于无限数量的适当积分(如我在上面的回答中所指出的)?

特殊部分来自二项式分布。我将使用与Beta类似的表示法来编写其PDF,而不是参数和变量的常用表示法:

f(x,y|s)=(y+xx)sx(1s)y

在此,成功和失败的次数,成功的可能性。您可以看到它与Beta发行版中的分子非常相似。实际上,如果您寻找二项式分布的先验条件,它将是Beta分布。同样也不奇怪,因为Beta的域是0到1,这就是您在贝叶斯定理中所做的:在参数积分,这是在这种情况下成功的概率,如下所示: 在此 -给定成功概率的概率(密度) Beta分布的先前设置和x,yss

f^(x|X)=f(X|s)f(s)01f(X|s)f(s)ds,
f(s)f(X|s)-给定概率的此数据集的密度(即观察到的成功和失败)。s

1
@西安OP似乎对历史不感兴趣。
阿克萨卡尔(Aksakal)

1
“对这个公式的起源的解释……在最初开发的任何情况下”对我来说听起来都像是历史:-)。
ub

3
我相信人们可能同时对历史和第一性原理感兴趣。:-)尽管您的答案在数学上是正确的,但不幸的是它太笼统了:一个人可以用有限积分使任何非负函数的密度。那么,这个特殊的发行家族有何特别之处呢?因此,您的方法似乎无法满足任何一种观点。
ub

2
@WillBradshaw,是的。通常,我们将二项式分布视为失败(或成功)次数的函数,并以概率和试验次数为参数。这样,它就是离散分布。但是,如果将给定成功和失败的次数作为参数,将其视为概率的函数,则一旦重新缩放它,它便成为Beta分布,即连续分布btw。
阿克萨卡尔(Aksakal)

2
在Beta分布维基百科文章的痕迹它皮尔逊说,就像通过@西安建议。斯蒂格勒(Stigler)在他的“统计史:1900年之前的不确定度的测量”中,简要说明了皮尔森(Pearson)用现代符号的推导。
ub

15

在此处输入图片说明

托马斯·贝叶斯(Thomas Bayes(1763))得出Beta分布[不使用此名称]作为后验分布的第一个示例,比Leonhard Euler(1766)Glen_b指出的Beta积分上的工作早了几年,但该积分也出现在Euler(1729或1738) [Opera Omnia,I14,1 {24]作为推广阶乘函数的一种方法这可能就是为什么归一化Beta常数也称为Euler函数戴维斯B(a,b)提到沃利斯(1616-1703),牛顿(1642-1726)和斯特林(1692-1770)甚至更早地处理积分的特殊情况。卡尔·皮尔森(Karl Pearson,1895年)首先将此发行系列归类为Pearson I型


尽管从历史上看并没有顺序出现,但是通过Fisher的分布可以直观地进入Beta分布,这对应于比率 在这里,我故意使用方差估计量的常用符号,因为这就是这种分布的方式出现并受到激励,以测试两个方差的相等性。然后 ,反之,如果,则 求的密度F(p,q)

ϱ=σ^12/σ^22pσ^12χp2qσ^12χq2
pϱq+pϱB(p/2,q/2)
ωB(a,b)
ω/a(1ω)/bF(2a,2b)
B(a,b)因此,分布是可变步长的变化:从分布的密度开始, 并考虑变量会转换为 ,雅可比矩阵为导致变换的密度 [其中所有归一化常数都是通过将密度强加到一个整数而获得的。F(p,q)
fp,q(x){px/q}p/21(1+px/q)(p+q)/2
y={px/q}{1+px/q}y(0,1)
x=qyp(1y)
dxdy=qp(1y)+qyp(1y)2=pq(1y)2
g(y)yp/21(1y)q/2+1(1y)2=yp/21(1y)q/2+1

2
+1。可能值得注意的是,K。Pearson不仅“分类”了Beta分布:他还通过一系列微分方程的解导出了这些分布,这是由他观察到的二项式差分方程与正态分布的微​​分方程之间的关系所激发的。将二项式差分方程泛化为超几何分布可生成微分方程的泛化,其解包括“ I型”和“ II型” Beta分布。这恰恰是OP寻求的从头开始的推导。
ub

2
我想我可以通过研究这个答案学到很多东西。目前这对我来说太高级了,但是当我有时间时,我会回来研究您提到的主题,然后再试一次以了解它。非常感谢。:)
布拉德肖

1

首先,我在脑海中对概念的数学精确描述并不擅长,但是我将使用一个简单的示例来尽力而为:

假设您有一把弓,许多箭和一个目标。进一步说,您的命中率(用于击中目标)恰好是到目标中心的距离的函数,其格式为 其中x是到中心的距离目标()。对于这将是高斯的一阶近似。这意味着您最常打靶子。同样,它近似于任何钟形曲线,例如,由于布朗粒子的扩散而导致的。λ

λ=g(x)=λmax(q|xx0|)1q, q>0, 0λλmax
x0q=1/2

现在,让我们进一步假设有人真的很勇敢/愚蠢地试图欺骗您,并在每次射击时都移动目标。因此,我们使本身成为随机变量。如果可以通过的(p-1)次来描述该人的运动分布(即),则简单随机变量的转换(记住)导致Beta分布:x0g(x)P(x0)=Cg(x)p1)P(λ)dλ=P(x0)dx0λ

P(λ)=P(g1(λ))|dg1(λ)dλ|=Cλp1(λmaxλ)q1

其中归一化常数是beta函数。对于beta分布的标准参数化,我们将设置。Cλmax=1

换句话说,β分布可以看作是抖动分布中心的概率分布。

我希望这种推论与您的老师的意思相近。请注意,和的函数形式非常灵活,并且可以从类似三角形的分布和U形分布(请参见下面的示例)到尖峰分布。g(x)P(x0)

仅供参考:我在博士论文中发现了这种副作用,并在论文中针对非平稳神经调节曲线导致了峰值计数分布为零膨胀(双峰模式为零)的情况进行了报道。应用上述概念得出了神经行为的Beta-泊松混合分布。该分布可以适合数据。拟合参数允许通过应用反向逻辑来估计分布和抖动分布。Beta-Poisson混合物是一种非常有趣且灵活的替代方法,可以用来代替过度的负二项分布(它是Gamma-Poisson混合物)。在下面找到一个示例“抖动g(x)p(x0) Beta”-实施中的想法:

导致Beta-Poisson峰值模型的抖动模型。

A:模拟的一维试验位移,从插图中的抖动分布()得出。与没有抖动的基本调谐曲线(实线,使用的参数:相比,试验平均的发射场(实线黑线)更宽且峰值速率更低。。:的所得分布在。跨越N = 100个试验和Beta分布的分析PDF ç:从泊松过程与参数模拟尖峰计数分布其中i表示试验的索引以及如上所示得出的Beta-Poisson分布。P(jitter)g(x)p1λmax=10,p=.6,q=.5λ X 0 λ λx0λiD:2D中类似的情况,具有随机移位角,导致相同的统计量。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.