非随机伯努利变量的这个随机和的概率分布是多少?


9

我试图找到随机分布的变量总数之和的概率分布。这是一个例子:

约翰在客户服务呼叫中心工作。他接到有问题的电话,并设法解决问题。他无法解决的问题,他将其转发给上级。假设他一天接到的电话数量遵循Poisson分布,平均值为。每个问题的难度从非常简单的东西(他绝对可以解决)到非常专业的问题(他都不知道如何解决)不等。假设他将能够解决第i个问题的概率p i遵循具有参数αβ的Beta分布,并且与先前的问题无关。他一天解决的电话数量分布如何?μpiαβ

更正式地说,我有:

= 0 1 2 NY=I(N>0)i=0NXii=0,1,2,...,N

其中X | p Ë ř Ñ Ò ù p p Ë 一个α β NPoisson(μ)(Xi|pi)Bernoulli(pi)piBeta(α,β)

请注意,目前,我很高兴假设是独立的。我也接受参数μ αβ不会相互影响,尽管在实际示例中,当μ大时,参数αβ如此,以使得Beta分布在成功率较低时具有更大的质量。费率p。但是现在让我们忽略它。Xiμ,αβμαβp

我可以计算出,仅此而已。我还可以通过模拟值来了解Y的分布(看起来像泊松,但我不知道这是否取决于我尝试的μ αβ的数量,或者它是否泛化,以及如何推广)可能因不同的参数值而改变)。对这种分布是什么或我如何推导它有任何想法吗?P(Y=0)Yμ,αβ

请注意,我也已在TalkStats论坛上发布了此问题,但我认为这里可能会引起更多关注。谨此致歉,并在此先感谢您的宝贵时间。

编辑:事实证明(请参见下面的非常有用的答案-并感谢那些!),这的确是一个分布,这是我根据直觉和一些模拟猜测得出的,但无法证明。我现在发现令人惊讶的虽然是泊松分布仅依赖于均值的Ë牛逼一个分布,但不受其方差。Poisson(μαα+β)Beta

例如,以下两个Beta分布具有相同的均值但具有不同的方差。为了清楚起见,蓝色PDF表示,红Ë 一个0.75 0.75 Beta(2,2)Beta(0.75,0.75)

Beta分布

然而,它们都将结果在相同的分布,其对我来说,似乎略微反直觉的。(不是说结果是错误的,只是令人惊讶!)Poisson(0.5μ)


N

N

您可能会看一下复合泊松(Poisson),但可能需要对0进行一些处理才能使其有用
Glen_b -Reinstate Monica

Answers:


6

XiNXi=1Xi=01Xi=1p1pμ。实际上就是这种情况,我们只需要一个额外的步骤即可到达那里。

pi

Pr(Xi|α,β)=01piXi(1pi)1Xipiα1(1pi)β1B(α,β)dpi=B(Xi+α,1Xi+β)B(α,β)

B(a,b)=Γ(a)Γ(b)Γ(a+b)Γ(x+1)=xΓ(x)

Pr(Xi=1|α,β)=Γ(1+α)Γ(β)Γ(1+α+β)Γ(α+β)Γ(α)Γ(β)=αα+β
XiBernoulli(αα+β)Yαμα+β

在图中的一个数字示例(带有R)...,垂直线来自模拟,红色点是上面得出的pmf:

draw <- function(alpha, beta, mu) 
{ N <- rpois(1, mu); p = rbeta(N, alpha, beta); sum(rbinom(N, size=1, prob=p)) }

pmf <- function(y, alpha, beta, mu)
  dpois(y, alpha*mu/(alpha+beta))

y <- replicate(30000,draw(4,5,10))
tb <- table(y)

# simulated pmf
plot(tb/sum(tb), type="h", xlab="Y", ylab="Probability")
# analytic pmf
points(0:max(y), pmf(0:max(y), 4, 5, 10), col="red")

在此处输入图片说明


3
  1. piBeta(α,β)E[pi]=αα+βi

  2. μαα+βμαα+β

  3. P(Y=0)=eμα/(α+β)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.