多项式分布系数之和


10

我要死了。每当我得到1、2或3时,我都写下一个“ 1”。每当我得到4时,我就写下“ 2”;每当我得到5或6时,我都会写下“ 3”。

令为我写下的所有数字乘积所需的总抛出次数。我想计算(或近似),并且可以根据正态分布给出近似值。N100000P(N25)

首先,我知道因为。现在,让,和分别是我写下1、2和3的次数。然后:P(N11)=1log3100.00010.48abc

P(a,b,cn)={(na,b,c)(12)a(16)b(13)c if a+b+c=n0 otherwise

我要计算的是:

P(a+b+c252b3c100000)

我该如何计算?

- 编辑:

因此,有人建议我可以将条件替换为:

P(a+b+c25αa+βb+γcδ)

其中,,和。β = 日志2 γ = 登录3 δ = 登录100000α=0β=log2γ=log3δ=log100000

这看起来确实更可解决!不幸的是,我仍然不知道如何解决。


2
+1如果您以的形式写条件,其中和。αa+βb+γcδα=0,β=log(2),γ=log(3),δ=log(100000)
whuber

我添加了这种写条件的新方法,但是不幸的是,我仍然没有关于如何解决该问题的最微妙的线索!
Pedro Carvalho

另一个提示是,如果出现次“ 2”,那么您将停止。因此,您可以使用参数和(也包含和)的负二项式来近似。确切的答案也是可以管理的,因为没有很多组合。此外,条件也不准确-您需要在第卷上记录“ 2”或“ 3”17170.5111/3N
概率

Answers:


1

当前问题是一个特定的情况,您要处理的是作为多项随机变量的线性函数的数量。通过枚举满足所需不等式的多项式组合,并对该范围内的分布求和,可以精确地解决您的问题。在大的情况下,这可能在计算上变得不可行。在这种情况下,可以使用对多项式的正态近似来获得近似分布。下面显示了此近似值的通用版本,然后将其应用于您的特定示例。N


一般逼近问题:假设我们有一个范围为的可交换随机变量序列。对于任何我们可以形成计数向量,计算每个结果出现在序列的前值中。由于基础序列是可交换的,因此计数向量分布为:Ñ Ñ1,2,...,mnNñXX(n)(X1,X2,...,Xm)n

X ~ Mu(n,θ)θ=limnX(n)/n.

现在,假设我们有一些非负权重并使用这些权重来定义线性函数:w=(w1,w2,...,wm)

A(n)i=1mwiXi.

由于权重为非负数,因此新数量。然后,我们定义数字,这是获得线性函数指定最小值所需的最少观察次数。在此值(随机)大的情况下,我们想要近似的分布。nÑ N(a)min{nN|A(n)a}N(a)


解决一般逼近问题:首先,我们注意到由于在不递减(之所以成立,是因为我们假设所有权重都是非负的),因此我们有:nA(n)n

P(N(a)n)=P(N(a)>n1)=P(A(n1)<a).

因此,的分布与的分布直接相关。假设前者数量很大,我们可以通过用多元正态分布的连续近似替换离散随机向量来近似后者的分布。这导致线性定量的正态近似,并且我们可以直接计算该量的矩。为此,我们使用,和 for。使用一些基本的代数,可以给我们:X Ñ ëX = Ñ θ VX = Ñ θ 1 - θ ÇX X Ĵ= - ñ θ θ ĴĴNAXA(n)E(Xi)=nθiV(Xi)=nθi(1θi)C(Xi,Xj)=nθiθjij

μE(1nA(n))=i=1mwiθi,

σ2V(1nA(n))=i=1mwiθi(i=1mwiθi)2=μ(1μ).

现在将正态近似为多项式,可以得到近似分布。应用此近似值可得出:A(n) ~ N(nμ,nμ(1μ))

P(N(a)n)=P(A(n1)<a)Φ(a(n1)μ(n1)μ(1μ)).

(符号是标准正态分布函数的标准表示法。)它是可以应用这种近似找到关于所述量概率为一个指定值。这是一个基本的近似,尚未尝试对基础多项计数值的值进行连续性校正。它是通过使用与精确线性函数相同的前两个中心矩进行正态近似获得的。Ñ ΦN(a)a


适用于您的问题:在您的问题中,您有概率,权重,并且截止值。因此,您具有(四舍五入到小数点后六位)。应用上面的近似值(四舍五入到小数点后六位):瓦特=0LN2LN3一个=LN100000μ=1θ=(12,16,13)w=(0,ln2,ln3)a=ln100000μ=16ln2+13ln3=0.481729

P(N(a)25)Φ(ln100000240.481729240.499666)=Φ(0.019838)=0.492086.

通过应用精确多项式分布,对满足条件所有组合求和,可以证明精确结果为。因此,我们可以看到,在当前情况下,近似值与精确答案非常接近。PÑ 25 = 0.483500P(A(24)<a)P(N(a)25)=0.483500

希望这个答案可以为您提供特定问题的答案,同时也可以将其置于概率结果的更通用框架内,该结果适用于多项式随机向量的线性函数。本方法应允许您获得所面临的一般类型问题的近似解决方案,并允许示例中特定数字的变化。


0

让我们做一个正常的近似。

首先,让我们在日志中重新表述您的问题。您在时间t = 0时从0开始。然后,在每个时间步骤中,添加:

  • 0,概率为1/2

  • log(2)的概率为1/6

  • log(3)概率为1/3

当总和超过时,您将停止此过程,此时您将查看已进行的抛出次数。您达到该点所需的投掷次数为 ^Nlog(105)N

我的计算器告诉我,您的增量的平均值为:,方差为。作为参考,终点为因此我们将在大约24步内与他联系0.25 11.510.480.2511.51

在我们完成25个步骤的条件下,总和的分布大致为以12.0为中心,方差为6.25的高斯分布。这使我们得到的粗略高斯近似p(N25)0.5

您需要查看N = 25处的总和的累积量,才能知道高斯近似是否正确。考虑到增量不是对称的,大约可能不是最好的


1
你能为我完成推导吗?我很难看到它。另外,没有确切的方法来计算它吗?
Pedro Carvalho

1
您不是在有log(1)和log(2)的地方表示“ log(2)”和“ log(3)”吗?
Glen_b-恢复莫妮卡

@GuillaumeDehaene写道: ...。根据我的计算,,与0.5截然不同P Ñ 25 = 1 - P Ñ 24 = 1 - 1127291856633071p(N25)0.5P(N25)=1P(N24)=1112729185663307164998372267786240.8266
狼人

你怎么得到P(n \ leq24)\约0.18?
Guillaume Dehaene
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.