如何使用前k个(经验)矩拟合近似PDF(即密度估计)?


11

我有一种情况,我能够估计数据集的(第一个)矩,并希望使用它来生成密度函数的估计。k

我已经遇到过Pearson分布,但是意识到它仅依赖于前4个矩(对矩的可能组合有一些限制)。

我还理解,当不使用更多假设时,任何有限的时刻集不足以“固定”特定分布。但是,我仍然希望获得更一般的发行版(Pearson发行版家族除外)。查看其他问题,我找不到这样的分布(请参阅:这里这里这里这里这里这里)。

是否可以为任何矩集定义一些(“简单”)广义分布族?(也许是一组可以采用标准正态分布的变换,并对其进行变换,直到所有k个矩集都被确认为止)kk

(如果我们假设其他矩是否为0,则我不太在乎)k+1

谢谢。

ps:我很高兴有一个扩展的例子。最好以R代码为例。


2
kkE[Xk]=(i)kϕX(k)(0)k

感谢@StephanKolassa-是否有扩展答案/ R代码示例的机会?
塔尔·加利里


亲爱的@whuber,能否请您提出一个R代码示例?(而且,这是否与狼人的答案相符?)
塔尔·加利利

这是与答案完全不同的方法。
ub

Answers:


11

方法1:高阶皮尔逊系统

p(x)

dp(x)dx=(a+x)c0+c1x+c2x2p(x)

(a,c0,c1,c2)

c0+c1x+c2x2p(x)

dp(x)dx=(a+x)c0+c1x+c2x2+c3x3p(x)

这产生了解决方案:

在此处输入图片说明

一段时间以前,我很有趣地解决了这个问题(与OP具有相同的思维方式):推导和解决方案在本书的第5章中给出;如果有兴趣,可以在这里免费下载:

http://www.mathstatica.com/book/bookcontents.html

请注意,虽然二阶(二次)皮尔逊族可以用前4个矩来表示,而三阶(三次)皮尔逊风格的族则需要前6个矩。

方法2:克-夏利扩展

kth

人口时刻还是样本时刻?

对于Pearson风格的系统:如果已知总体的矩,则使用较高的矩应明确地产生更好的拟合度。但是,如果观察到的数据是从总体中抽取的随机样本,则需要权衡取舍:较高阶多项式意味着需要较高阶矩,并且后者的估计可能不可靠(具有高方差),除非样本量为“大”。换句话说,给定样本数据,使用较高矩进行拟合可能会变得“不稳定”并产生较差的结果。Gram-Charlier扩展也是如此:增加一个额外项实际上会产生更差的拟合,因此需要格外小心。


亲爱的@wolfies-感谢您的回答!如果我对您的理解正确,那么Gram-Charlier展开式将更符合我所寻找的内容(尽管更有趣的Pearson分布很有趣)。我看了您的书(从第175页开始的第5章),并确实看到了其中的详细说明(我也提到了如何处理估计的力矩)。唯一的事情是我无法使用您的代码(因为我是R用户)。感谢您的回答(以及您的书总体上似乎令人印象深刻且有趣)
Tal Galili 2015年

2
刚刚找到了处理各种方法的R包:cran.us.r-project.org/web/packages/PDQutils/vignettes/…–
Tal Galili
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.