统计中的大多数渐近结果证明,当,基于似然函数的二阶泰勒展开,估计量(例如MLE)收敛到正态分布。我相信在贝叶斯文学中也有类似的结果,即“贝叶斯中心极限定理”,它表明后验渐近收敛为n → ∞的法线。
我的问题是-根据泰勒级数的第三项,分布是否收敛到正态“之前”?还是一般不可能做到这一点?
统计中的大多数渐近结果证明,当,基于似然函数的二阶泰勒展开,估计量(例如MLE)收敛到正态分布。我相信在贝叶斯文学中也有类似的结果,即“贝叶斯中心极限定理”,它表明后验渐近收敛为n → ∞的法线。
我的问题是-根据泰勒级数的第三项,分布是否收敛到正态“之前”?还是一般不可能做到这一点?
Answers:
您在搜索Edgeworth系列吗?
http://en.wikipedia.org/wiki/Edgeworth_series#Edgeworth_series
(请注意,埃奇沃思死于1926年,应该在大多数著名的统计学家中吗?)
序列不可能“收敛”到一件事然后到另一件事。渐近展开式中的高阶项将变为零。他们告诉您的是,对于任何给定的n值,它们接近零。
对于中心极限定理(例如),适当的扩展是特征函数(累积量生成函数,cgf)的对数。分布的标准化固定了cgf的第零,第一和第二项。其余项的系数为累积量,它们有序地取决于。发生在CLT的标准化(分割的总和Ñ随机变量被什么东西正比于Ñ 1 / 2 --without这将不会发生收敛)导致米个累积量-这毕竟取决于米日时刻-到除以(n,但在同一时间,因为我们正在总结Ñ而言,净结果是,米个阶项正比于ñ / Ñ 米/ 2 = Ñ - (米- 2 )/ 2。因此,标准化的总和的第三累积量正比于1 / Ñ 1 / 2,第四累积量正比于1 / Ñ, 等等。这些是高阶术语。(有关详细信息,请参见例如Yuval Filmus的本文。)
通常,的高负功率比低负功率小得多。始终可以通过取足够大的n来确保这一点。因此,对于真正的大ň我们可以忽略所有负幂ñ:他们收敛于零。沿途会聚,偏离从极限与由附加项提高了准确度测量:在1 / Ñ 1 / 2项是最初的“修正”,或离开限制值; 下一个1 / nterm是对它的更小,更迅速消失的更正,依此类推。简而言之,附加术语为您提供了序列收敛到其极限的速度的图片。
这些附加项可以帮助我们对n的有限(通常较小)值进行校正。他们表现出了所有的时间在这方面,如t检验的陈的修改,它利用三阶(1 / ñ 1 / 2)项。
这是尝试回答您的有见地的问题。我已经看到将泰勒级数的第三项包括在内,以提高该级数收敛到真实分布的速度。但是,根据我有限的经验,我还没有看到第三和更高时刻的用法。
正如John D. Cook在他的博客(此处和此处)中指出的那样,除了Berry-Esseen定理之外,在这个方向上没有做过很多工作。我的猜测是(从大约近似误差的博客的观察被界定),作为MLE的渐近正态性在收敛的速率保证Ñ 1 / 2(Ñ,作为样本大小),考虑更高的时刻不会改善正态性结果。
因此,我想您的问题的答案应该为否。渐近分布收敛到正态分布(在Lindberg CLT的规则性条件下,通过CLT收敛)。但是,使用高阶项可能会增加渐近分布的收敛速度。
绝对不是我的领域,但是我很确定三阶和更高阶渐近性存在。这有帮助吗?
罗伯特·斯特劳德曼(Robert L. 高阶渐近逼近:Laplace,Saddlepoint和相关方法 《美国统计协会学报》第1卷。95,No.452(2000年12月),第1358-1364页