如果我具有泊松分布的随机变量,参数为,则(即平均值的整数下限)?λ 1,λ 2,... ,λ Ñ ÿ = ⌊ Σ ñ 我= 1 X 我
泊松的总和也就是泊松,但我对统计数据没有足够的信心来确定上述情况是否相同。
如果我具有泊松分布的随机变量,参数为,则(即平均值的整数下限)?λ 1,λ 2,... ,λ Ñ ÿ = ⌊ Σ ñ 我= 1 X 我
泊松的总和也就是泊松,但我对统计数据没有足够的信心来确定上述情况是否相同。
Answers:
当的分布已知并在自然数上得到支持时,该问题的一般性要求的分布。(在问题中,的泊松分布为参数和。)X X λ = λ 1 + λ 2 + ⋯ + λ Ñ米= Ñ
的分布很容易通过的分布确定,其概率生成函数(pgf)可以根据的pgf确定。这是推导的概述。m Y X
为的pgf 写,其中(根据定义)。 由构造,使得它的pgf为X p Ñ = 镨(X = Ñ )米ÿ X q
因为这对于绝对收敛,我们可以将术语重新排列为以下形式的总和:
对于。幂级数的功能的由每的系列的术语开始与:这有时被称为抽取的。Google搜索目前并未提供关于抽取的大量有用信息,因此为了完整起见,这里是公式的推导。X 吨d 米,吨 p 米第 p 吨个 p
令为任何原始的统一根;例如,取。然后从和得出米第 ω = EXP (2 我π /米)ω 米 = 1 Σ 米- 1 Ĵ = 0 ω Ĵ = 0
要看到这一点,请注意,运算符是线性的,因此只要根据。将右手边应用于给出 { 1 ,x ,x 2,… ,x n,… } x n
当和相差的倍数时,总和中的每一项等于,我们得到。否则,这些项将循环通过幂,并且这些总和为零。因此,该运算符将所有幂保留为模而杀死所有其他幂:这正是所需的投影。Ñ 米1 X Ñ ω 吨- ñ X 吨米
的公式很容易通过更改求和的顺序并将其中一个和识别为几何,从而以封闭形式编写:
例如,参数的Poisson分布的pgf 为。如果,并且的pgf 将是p (X )= EXP (λ (X - 1 ))米= 2 ω = - 1 2 ÿ
这种方法的一种用途是计算和矩。在处评估的pgf 的导数的值是阶乘矩。的时刻是第一的线性组合阶乘矩。使用这些观察结果,我们发现,例如,对于泊松分布,其均值(这是第一个阶乘矩)等于,的均值等于,并且的平均值等于米ÿ ķ 第 X = 1 ķ 个ķ 个 ķ X λ 2 ⌊ (X / 2 )⌋ λ - 13⌊(X/3)⌋λ-1+ë-3λ/2(罪(√:
的均值分别表示为函数的蓝色,红色和黄色:渐近地,与原始Poisson均值相比,该均值下降了。λ (米- 1 )/ 2
可以获得类似的方差公式。(随着增加,它们变得凌乱,因此被忽略。他们明确确定的一件事是,当,倍数不为泊松:它没有均值和方差的特征相等)这是方差的图作为的函数对于:米> 1 Ŷ λ 米= 1 ,2 ,3
有趣的是,对于更大的值,方差增加。从直觉上讲,这是由于两个相互竞争的现象引起的:底数函数实际上是对原本不同的值进行分组。这必须导致方差减小。同时,如我们所见,均值也在变化(因为每个bin均以其最小值表示);这必须使等于等于均值差平方的项相加。随着较大的值,较大方差增加变得更大。λ 米
与的方差行为非常复杂。让我们以展示它可以做什么的快速仿真结束。这些图显示了的方差与Poisson分布的方差之间的差异,其中Poisson分布的各个值介于到。在所有情况下,这些图似乎都已达到右侧的渐近值。米米⌊ X /米⌋ X X λ 1 5000R
set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
x <- rpois(20000, lambda)
v <- sapply(1:floor(lambda + 4*sqrt(lambda)),
function(m) var(floor(x/m)*m) - var(x))
plot(v, type="l", xlab="", ylab="Increased variance",
main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})
sapply()
用于仿真的示例。谢谢。
正如迈克尔·切尔尼克(Michael Chernick)所说,如果各个随机变量是独立的,则总和就是具有参数(均值和方差),您可以将其称为。 λ
除以可将均值减少到并减少方差因此方差将小于等效的Poisson分布。正如迈克尔所说,并非所有值都是整数。λ / Ñ λ / Ñ 2
使用下限函数会稍微降低平均值,大约为,并且也会以稍微更复杂的方式稍微影响方差。尽管您具有整数值,但方差仍将大大小于平均值,因此您的分布将比Poisson窄。
独立泊松随机变量的平均值的概率质量函数可以明确地写下来,尽管答案可能对您没有太大帮助。正如迈克尔·切尔尼克(Michael Chernick)在评论中指出的那样,具有各自参数的独立泊松随机变量的和是具有参数的泊松随机变量。因此, 因此,是一个随机变量,其概率为Σ 我X 我X 我λ 我 λ = Σ 我λ 我 P { Ñ Σ我= 1 X 我 = ķ } = EXP (- λ )λ ķ ÿ =ñ-1Σ Ñ 我= 1 X我ķ/ÑEXP(-λ)λķ
Y将不会是泊松。请注意,泊松随机变量采用非负整数值。一旦被常数除,您将创建一个可以具有非整数值的随机变量。它仍将具有泊松的形状。只是离散概率可能出现在非整数点。