一种近似于正态分布的幼稚方法是将大约均匀分布在上的IID随机变量加在一起,然后根据中心极限定理对它们进行重新缩放和重新缩放。(旁注:还有更精确的方法,例如Box-Muller变换。)IID随机变量的总和称为均匀总和分布或Irwin-Hall分布。
用正态分布近似均匀和分布时的误差有多大?
每当出现这种类型的问题以近似IID随机变量的总和时,人们(包括我)都会提出Berry–Esseen定理,这是中心极限定理的有效形式,因为存在第三阶矩:
其中是n个 IID随机变量的重新定标和的累积分布函数,\ rho是绝对的第三中心矩E |(X-EX)^ 3 |。,\ sigma是标准偏差,C是绝对常数,可以取为1甚至1/2。
这是不令人满意的。在我看来,对于离散的二项式分布,Berry-Esseen估计最接近锐利,对于对称的二项式分布,最大误差为。最大的错误来自最大的跳跃。但是,统一的总和分布没有跳跃。
数值测试表明,误差的减小比c / \ sqrt n更快。
使用,Berry–Esseen估计为
这对于为约,,和,分别。对于实际的最大差异似乎是约,和,分别,这要小得多,并且似乎落入如,而不是。