有没有中心极限定理不成立的例子?


32

维基百科说-

在概率论中,中心极限定理(CLT)确定,在大多数情况下,添加独立随机变量时,即使原始变量本身不存在,其适当归一化的总和仍趋于正态分布(非正式地为“钟形曲线”)。正态分布...

当它说“在大多数情况下”时,中央极限定理在哪些情况下不起作用?

Answers:


33

要了解这一点,您需要首先声明中央极限定理的版本。这是中心极限定理的“典型”陈述:

Lindeberg–Lévy CLT。假设X1,X2,是独立同分布的随机变量与序列E[Xi]=μVar[Xi]=σ2<。令Sn:=X1++Xnn。然后当 n接近无穷大时,随机变量在分配到正常收敛Ñ0σ2,即n(Snμ)N(0,σ2)

n((1ni=1nXi)μ d ñ(0σ2

那么,这与非正式描述有何不同?差距何在?您的非正式描述与此描述之间存在一些差异,其中一些已在其他答案中进行了讨论,但并不完全。因此,我们可以将其转化为三个具体问题:

  • 如果变量分布不均怎么办?
  • 如果变量具有无限方差或无限均值怎么办?
  • 独立有多重要?

一次服用这些

分布不均,最好的一般结果是中央极限定理的Lindeberg和Lyaponov版本。基本上,只要标准偏差不会过分增大,您就可以从中得到一个不错的中心极限定理。

Lyapunov CLT。[5] 假设是独立随机变量的序列,每个具有有限预期值μ 和方差σ 2 定义:小号2 Ñ = Σ Ñ = 1 σ 2 X1个X2μ一世σ2sñ2=一世=1个ñσ一世2

如果由于某种,李雅普诺夫的病情 LIM ñ →交通1δ>0被满足,则一个的总和 X-μ/šÑ 收敛在分配给标准正态随机变量,当n趋向无穷大:ñ1个sñ2+δ一世=1个ñË[|X一世-μ一世|2+δ]=0X一世-μ一世/sñ

1个sñ一世=1个ñX一世-μ一世 d ñ01个

对于具有无限方差的变量,存在类似于中心极限定理的无限方差定理,但条件比通常的中心极限定理更窄。本质上,概率分布的尾部必须是0 < α < 2。在这种情况下,适当的标定求和式收敛到Levy-Alpha 稳定分布。|X|-α-1个0<α<2

独立的重要性对于非独立序列,有许多不同的中心极限定理。它们都是高度相关的。正如蝙蝠侠所指出的,马丁格莱斯(Martingales)一个。 这个问题是一个持续的研究领域,根据感兴趣的具体情况有很多不同的变化。 数学交换问题是与此问题相关的另一篇文章。X一世


2
我已经从一个我认为由于引用系统而无法使用的公式中删除了一个迷离的“>”-如果有意,请随时撤消我的编辑!
银鱼'18

三角形阵列CLT可能比所陈述的更具代表性。至于不独立的情况,C子CLT是合理常用的情况。
蝙蝠侠

@蝙蝠侠,什么是三角阵列CLT的示例?随时编辑我的回复,进行添加。我不熟悉那个。
约翰


1
“只要标准偏差不生长太似地”或缩小(例如:σ一世2=σ一世-1个2/2
leonbloy

21

尽管我很确定以前已经回答过,但是这里还有一个:

中心极限定理有几种形式,最一般的是给定任意概率密度函数,变量的总和将以均值的平均值正态分布,并且方差为总和个体差异。

一个非常重要且相关的约束是给定pdf的均值和方差必须存在并且必须是有限的。

因此,只要取没有平均值或方差的任何pdf格式-中心极限定理就不再成立。因此,以洛伦兹分布为例。


+1或采用具有无限方差的分布,例如随机游走的分布。
亚历克西斯

2
@Alexis -假设你正在寻找一个随机游走在有限时间点,我还以为它会具有有限的方差,是的总和 IID每个步骤有限方差ñ
亨利

1
@亨利:不是,不是在某个时间点假设,而是所有无限长的可能随机游动的分布方差。
亚历克西斯

1
@Alexis如果随机游动的每个步骤以相等的概率为+ 11 iid且位置为Y n = n 1 X i,那么中心极限定理正确地暗示当n ∞时,您具有X一世+1个-1个ÿñ=1个ñX一世ñ在分布收敛到Ñ01ñ1个ñÿñ=ÿñññ01个
亨利

1
@Alexis对CLT无关紧要,因为每个单独的分布仍然具有有限的方差。
立方

15

不,CLT在其假设成立时始终成立。诸如“在大多数情况下”之类的限定条件是对应应用CLT的条件的非正式引用。

例如,来自柯西分布的自变量的线性组合将不等于正态分布变量。原因之一是对于柯西分布,方差未定义,而CLT对方差设置了某些条件,例如,必须是有限的。一个有趣的含义是,由于Monte Carlo模拟是受CLT推动的,因此在处理诸如Cauchy之类的粗尾分布时,您必须小心使用Monte Carlo模拟。

请注意,有一个通用的CLT 版本。它适用于无限或不确定的方差,例如柯西分布。与许多行为良好的分布不同,柯西数的正确归一化总和仍为柯西。它不会收敛于高斯。

顺便说一下,不仅高斯分布而且许多其他分布都有钟形PDF,例如Student t。这就是为什么您引用的描述过于宽泛和不精确,也许是故意的。


7

ñ

ññ=10001个/2π0.4

在此处输入图片说明

library(MASS)
n <- 1000
samples.from.t <- replicate(1e5, sqrt(n)*mean(rt(n, df = 2)))
truehist(samples.from.t, xlim = c(-10,10), col="salmon")

3
您必须在这里稍加小心,就像您使用 Ť30.41个6π0.231个
亨利

这是个好主意sd(x)如果 CLT起作用,可以通过Slutzky定理收敛到N(0,1)变量,从而标准化均值。我想简化示例,但您当然是对的。
克里斯多夫·汉克

6

CLT由于非常实际的原因而无法成立的简单情况是,随机变量序列严格从一侧接近其概率极限。例如,在估算器中会遇到这种情况,估算器估算边界上的某物。

θü0θθθθ

正确缩放的估算器确实具有极限分布-但不是“ CLT品种”。


3

您可以在此处找到快速解决方案

出现中心极限定理的例外

  1. 当存在多个相同高度的最大值时,并且
  2. 二阶导数最大消失的地方。

@cherub的答案中概述了某些其他例外。


math.stackexchange上已经问过同样的问题。您可以在那里查看答案。


5
所谓“最大值”,是指模式吗?成为双峰与不满足CLT无关。
累积

中号ž=ñ=-PX=ñžñ

@AlexR。如果不通读链接,答案根本就没有意义,即使有链接,答案也不是很清楚。我倾向于拒绝投票,因为它比仅链接的答案还要糟糕。
累计
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.