Beta分布的两个分位数是否确定其参数?


9

如果我在开放时间间隔给出了两个分位数及其对应的位置(每个,我是否总能找到在指定位置具有那些分位数的beta分布的参数?q 1q 2120 1 (q1,q2)(l1,l2)(0,1)


1
不,基本反例(q1,q2)=(0,1)和(l1,l2)=(0,1)不管参数如何。
蒂姆

1
@Tim我想我明白你的意思,但你的反不满足我规定的条件(例如,该位置是在开区间0 1 (0,1))。
博塔

1
我认为您可以通过数字方式进行操作(并且会有一个独特的解决方案),但是这需要一些努力。
Glen_b-恢复莫妮卡

1
我也认为-数值求解并不困难,但是要找到唯一性的论点并不容易。
猫王

1
@Elvis实际上,我怀疑通过查看两个变量(OP的lq)的对数可能有一种方法。lq
Glen_b-恢复莫妮卡

Answers:


9

如果数据满足明显的一致性要求,答案是肯定的。该参数很简单,基于简单的构造,但是需要进行一些设置。这可以归结为一个直观上吸引人的事实:对于更大的x而言,增大Beta a b 分布中的参数a会a增大其密度(PDF)的值,而不是较小的x;而增加b则相反:x越小,PDF的值增加越大。(a,b)xxbx

详细信息如下。


令期望的q 1q1分位数为x 1x1,期望的q 2q2分位数为x 2,x2其中1 > q 2 > q 1 > 01>q2>q1>0且(因此)1 > x 2 > x 1 > 01 > x2>x1>0。然后是唯一的aabb,其Beta a b (a,b)分布具有这些分位数。

证明这一点的困难在于Beta分布涉及顽固归一化常数。回忆一下定义:对于a > 0a>0b > 0b>0,Beta a b (a,b)分布具有密度函数(PDF)

f x ; a b = 1B a b xa-11-xb-1

f(x;a,b)=1B(a,b)xa1(1x)b1.

归一化常数是Beta函数

b = 1 0 X - 11 - X b - 1d x = Γ a Γ b Γ a + b

B(a,b)=10xa1(1x)b1dx=Γ(a)Γ(b)Γ(a+b).

如果我们尝试直接相对于ab区分f x ; a b f(x;a,b)一切都会变得混乱,这将是尝试演示的蛮力方式。ab

避免必须分析Beta函数的一种方法是,注意分位数是相对面积。 那是,

q = ˚F X ; b = X 0 ˚F X ; b d X1个0 ˚F X ; b d X

qi=F(xi;a,b)=xi0f(x;a,b)dx10f(x;a,b)dx

对于= 1 2i=1,2。这里,例如,是PDF和累积分布函数(CDF)˚FF一个测试的1.15 0.57 (1.15,0.57)分布其中X 1 = 1 / 3x1=1/3q 1 = 1 / 6q1=1/6

图1

左侧绘制了密度函数x f x ; a b xf(x;a,b)q 1q1x 1左侧曲线下方的面积,以红色显示,对于曲线下方的总面积。 q 2x 2左侧的面积,等于红色和蓝色区域的总和,再次相对于总面积。右边的CDF显示x 1q 1x 2x1q2x2(x1,q1)q 2(x2,q2)在其上标记两个不同的点。

在该图中,X 1q 1(x1,q1)固定在1 / 3 1 / 6 (1/3,1/6)一个a被选择为1.151.15,然后的值bb被发现的该X 1q 1(x1,q1)位于上Beta a b (a,b) CDF。

引理:总是可以找到这样的bb

具体而言,使x 1q 1(x1,q1)一劳永逸。(在以下插图中,它们保持不变:在所有三种情况下,x 1x1左侧的相对面积均等于q 1。q1)对于任何a > 0a>0,引理声称存在唯一的bb值,用b表示a b(a),其中x 1x1是Beta a b a q 1q1分位数(a,b(a)) 分配。

要了解原因,首先请注意,当bb接近零时,所有概率都在00值附近堆积,而F x 1 ; a b F(x1;a,b)接近11。当bb接近无穷大时,所有概率都在值11附近堆积,因此F x 1 ; a b F(x1;a,b)接近00。在这两者之间,函数 b F x 1 ; a b bF(x1;a,b)严格增加bb

这种说法在几何上是显而易见的:这等于说,如果我们看一下曲线下的左侧区域x x a - 11 - x b - 1xxa1(1x)b1 相对于曲线下的总面积,并将其与曲线下的相对面积X X - 11 - X b ' - 1xxa1(1x)b1b ' > bb>b,那么后者面积相对较大。这两个函数的比率为1 - X b ' - b(1x)bb。这是一个函数等于 11 X = 0 x=0,稳步下降到 00 X = 1。x=1. 因此的功能的高度 X ˚F X ; b 'xf(x;a,b)相对较大的比的高度 X ˚F X ; a b xf(x;a,b)对于 xx的左边X 1x1比他们的 Xx向右侧 X 1x1. 因此,前者中 x 1左侧的区域必须相对大于 x 1右侧的区域 (例如,这很容易使用黎曼和转化为严格的论点。)x1x1.

我们已经看到,函数b f x 1 ; a b bf(x1;a,b)严格单调递增,极限值为001 1分别为b 0b0b b,。它也是(显然)是连续的。因此,存在一个数b a b(a),其中f x 1 ; a b a = q 1f(x1;a,b(a))=q1 这个数字是唯一的,证明了引理。

同一论点表明,随着b的b增加,x 2x2左侧的面积也增加。 因此值˚F X 2 ; b f(x2;a,b(a))范围以上的数字的一些时间间隔为一个a从几乎进展00至几乎.f x 2 ; a b a f(x2;a,b(a))a 0a0 的极限是q 1q1.

这是一个aa接近00(等于0.10.1)的示例。与X 1 = 1 / 3x1=1/3q 1 = 1 / 6q1=1/6(如前面的图),b 0.02。b(a)0.02.x 1x1x 2 之间几乎没有区域x2:

Figure 2

CDF实际上在x 1x1x 2x2,之间是平坦的q 2q2实际上在q 1的q1.顶部 极限为a 0a0q 2q 1q2q1.

在另一个极端,足够大的值的一个导致˚F X 2 ; b 任意地接近1。 下面是一个例子X 1q 1如前。

Figure 3

这里a = 8b a 接近10。 现在F x 2 ; a b a 本质上是1 x 2的右边几乎没有面积

因此,您可以选择q 11之间的任意 q 2并调整a直到F x 2 ; a a b = q 2 正如之前,这一个必须是唯一的,QED


R查找解决方案的工作代码发布在从两个任意点(分位数)确定beta分布参数αβ上


这个答案表明,如果我们选择一个固定的ab,我们将找到一个唯一的对应值。这将有可能构造具有在一个固定的区域的函数[ 0 X 1 ][ X 1X 2 ][ X 21 ]。我不立即明白为什么这可以保证αβ的集合是唯一的。您愿意阐述并启发我吗?

@Jan Could explain what you mean by the "set of α and β"? Those symbols do not appear anywhere in this thread.
whuber
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.