离散分布近似


11

当您知道离散分布X的均值\ mu,方差\ sigma ^ 2,偏度\ gamma_1超峰\ gamma_2对于给定的两个整数m,n逼近的最佳方法是什么,并且从形状\ gamma_1\ gamma_2的(非零)度量中清楚看出,法线近似不适合吗?Ñ μ σ 2 γ 1 γ 2 X γ 1 γ 2Pr[nXm]m,nμσ2γ1γ2Xγ1γ2

通常,我会使用带整数校正的正态近似值...

Pr[(n½)X(m+½)]=Pr[(n½)μσZ(m+½)μσ]=Φ((m+½)μσ)Φ((n½)μσ)

...如果偏度和过度峰度(接近)为0,但事实并非如此。

我必须对具有γ1\ gamma_2不同值的不同离散分布执行多个近似γ2。因此,我有兴趣了解是否存在使用γ1γ2选择比常规近似更好的近似的过程。

Answers:


4

这是一个有趣的问题,实际上并没有很好的解决方案。有几种解决此问题的方法。

  1. 假设潜在的分布和匹配时刻-如@ivant和@onestop的答案所建议。缺点之一是多变量概括可能不清楚。

  2. 鞍点近似值。在本文中:

    Gillespie,CS和Renshaw,E 。改进的鞍点近似。 数学生物科学,2007。

    我们仅在最初的几分钟内着眼于恢复pdf / pmf。我们发现,当偏度不太大时,此方法有效。

  3. Laguerre扩展:

    Mustapha,H.和Dimitrakopoulosa,R . 带有矩的多元概率密度的广义Laguerre展开计算机与数学及其应用,2010年。

    本文中的结果似乎更有希望,但我没有对其进行编码。


4

使用前四个时刻将分布拟合到数据正是Karl Pearson设计了Pearson系列连续概率分布的目的(当然,最近最大可能性是最大可能性)。应该简单明了地适合该家族的相关成员,然后使用与上面正态分布相同的连续性校正类型。

我认为您必须拥有真正巨大的样本量?否则,对偏度,尤其是峰度的样本估计通常是不精确的,并且对异常值非常敏感。无论如何,我强烈建议您考虑使用L矩作为一种替代方法,它比平时具有一些优势。有利于将分布拟合到数据。


2

您可以尝试使用偏态正态分布,并查看给定偏度的特定数据集的过量峰度是否足够接近分布的过量峰度。如果是这样,则可以使用偏态正态分布cdf估计概率。如果不是这样,您将不得不转换为正态/偏态pdf的转换,类似于用于偏态正态分布的pdf转换,这将使您可以控制偏度和峰度。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.