高斯(正态)分布最令人惊讶的特征是什么?


52

可以通过明确给出其密度来定义上的标准化高斯分布: R

12πex2/2

或其特征功能。

就像在这个问题中提到的那样,它也是样本均值和方差是独立的唯一分布。

您知道高斯测量的其他令人惊讶的替代特征是什么?我会接受最令人惊讶的答案

Answers:


39

我个人最令人惊讶的是关于样本均值和方差的一个,但是这是另一个(也许)令人惊讶的特征:如果和是具有有限方差且和独立的IID ,则和是正常的。XYX+YXYXY

凭直觉,我们通常可以通过散点图确定变量何时不是独立的。因此,想象一下对的散点图看起来独立。现在旋转45度,然后再次看:如果它仍然看起来独立,则和坐标必须分别是法线(当然,这都是松散的说法)。X Y(X,Y)XY

要了解为什么直观的位起作用,请看一下

[cos45sin45sin45cos45][xy]=12[xyx+y]

3
周杰伦-这基本上是对均值和方差独立的重新陈述。 是重新定标的平均值,而是重新定标的标准偏差。X YX+YXY
概率

5
@probabilityislogic-我喜欢您所说的直觉,但我不认为这完全是重述,因为并不完全是SD的缩放比例:SD忘记了符号。因此,均值和SD的独立性源自和独立性(当),而不是相反。那可能就是您所说的“基本”。无论如何,这是好东西。X + Y X Y n = 2XYX+YXYn=2

4
在哪里可以找到该财产的证据?
罗伊2013年

1
@Royi 在这里看到16 。对于(a),请注意。对于(b),请注意,它渴望替换从中获得。如果,则 ,因此对于所有,且有一个序列使得对于所有,都为和,这与在处的连续性矛盾φ 2 φ - 2 = φ φ - 4 ψ = φ φ - ψ = ψ 2 2 ñ2X=(X+Y)+(XY)φ(2t)φ(2t)=(φ(t)φ(t))4ψ(t)=φ(t)φ(t)φ0=0ψ0=0Ñψ0ψ(t)=ψ22n(t2n)φ(t0)=0ψ(t0)=0nÑÑ0φÑ=0Ñφ0ψ(t02n)=0tntn0φ(tn)=0nφ0。(c)直截了当[续]
加布里埃尔·罗蒙

1
对于(d),。注意,因此。将其插入先前的等式中,并证明对于固定,意味着对所有。这意味着是真实的,并且(a)中的等式变成了所要求的。再次证明并使用得到。因此和φt=1-t2γ(t)=γ2n(t2n)γ=1+Ö2LIMñγ2Ñφ(t)=1t22+o(t2)γ(t)=1+o(t2)tlimnγ2n(t2n)=1φ φ = φ 2 2 Ñγ(t)=1tφφt=1-t2φ(t)=φ22n(t2n)LIMÑφ2 2 Ñφ(t)=1t22+o(t2)φ=ë-2/2Xlimnφ22n(t2n)=et2/2φ(t)=et2/2X是正常的。
加布里埃尔·罗蒙


22

有整本书写过:“正态概率定律的特征”,AM Mathai和G. Perderzoli。JASA的简要评论(1978年12月)提到以下内容:

令为独立随机变量。那么和是独立的,其中,当且仅当是正态分布的。n i = 1 a i x in i = 1 b i x i a i b i0 X iX1,,Xni=1naixii=1nbixiaibi0Xi


3
必须存在诸如丢失的条件?例如,如果n = 2 和不是独立的。a i = b i = 1 X 1 + X 2 X 1 + X 2<a,b>=0ai=bi=1 X1+X2X1+X2
罗宾吉拉德

1
@robin好抓住。我也一直对隐式量词感到困惑。不幸的是,我所能获得的只是评论中的(引语)引文,而不是本书。在图书馆找到它并浏览它会很有趣...
whuber

感觉就像是G. Jay Kerns(目前排名第一)的答案的概括。
vqv 2010年

我认为您可能正在寻找Lukacs&King(1954)的论文。请参阅math.SE上的此答案,以及指向上述论文的链接。
主教

2
这个命题说“ where ”的地方,对 “”的标量意味着什么?我讨厌看到“ where”代替“ for each”或“ for some”。其中,”应该被用来解释一个人的符号,如‘哪里是光的速度和是国内产品’总值(GDP)等a i b i0 c gaibi0aibi0cg
迈克尔·哈迪

17

高斯分布是唯一具有有限方差的和稳定分布。


8
它们是求和稳定的,并且它们是具有有限方差的唯一变量,都被CLT强加给我们。该断言的有趣之处在于,还存在其他和稳定分布!
ub

1
@whuber:确实!这个特征有点扭曲,其他和稳定的分布也许更奇怪。
shabbychef 2010年

@whuber实际上,我看不到CLT如何暗示这一事实。似乎只是告诉我们,渐近线的法线和是正态的,而不是有限的和是正态分布的。还是您必须以某种方式使用Slutsky定理?
shabbychef 2010年

3
采用通常的标准化方法,两个正态之和是一个正态分布X_0的总和加上一系列X_1,X_2,...的极限分布,而总和是X_0,X_1 ...的极限分布。由Lindeberg-Levy CLT制作的是正常的。
ub

17

斯坦因引理提供了非常有用的特征。 对于具有所有绝对连续函数,是标准高斯iff 。E f 'Z = E Z f Z f E | f 'Z | < Z

Ef(Z)=EZf(Z)
fE|f(Z)|<

12

定理[Herschel-Maxwell]:令为随机向量,(i)到正交子空间的投影是独立的,并且(ii)的分布仅取决于长度。然后正态分布。ZRnZžZZ

乔治·科布(George Cobb)在《教学统计》中引用:一些重要的紧张关系(智利统计杂志,第2卷,第1期,2011年4月),见第41页。54。

Cobb将此特征用作推导,和分布的起点,而无需使用微积分(或很多概率论)。˚Fχ2tF


9

令和是两个具有共同对称分布的独立随机变量,使得ξηξ

P(|ξ+η2|t)P(|ξ|t).

然后这些随机变量是高斯的。(很明显,如果和是居中的高斯,则为真。)ηξη

这是鲍勃科夫-胡德定理


9

这不是特征,而是一种推测,它可以追溯到1917年,归因于Cantelli:

如果是的正函数,并且和是独立的随机变量,使得是正常的,则几乎在任何地方都是常数。- [R X ý Ñ 0 1 X + ˚F X ÿ ˚FfRXYN(0,1)X+f(X)Yf

杰拉德·莱塔克(GérardLetac)在这里提到。


提到它很好!我不知道直觉,是吗?
罗宾吉拉德2011年

@robin这就是使这个猜想如此特别的原因:一个完全基本的陈述,一些显而易见的方法却惨遭失败(特征功能),而一个人却一无所知...顺便说一句,如果有人猜想这个猜想是真的还是假的?即使那对我来说也不明显。
有没有

2
如果杰拉德·莱塔克(GérardLetac)未能证明这一点,那么它可能会在相当长的一段时间内保持公开的猜测……!
西安

@西安:我完全同意。(不知道您正在网络的这些区域中漫游……那真是个好消息。)
2012年

6
@西安这是Victor Kleptsyn和Aline Kurtzmann 的预印本,带有Cantelli猜想的反例。该构造使用一种新工具,作者将其称为布朗质量传递,并产生不连续函数。作者陈述说,他们相信如果有人要求是连续的(它们是两个连续函数的混合),则Cantelli猜想成立。˚Fff
难道

8

假设有人正在使用iid数据估计位置参数。如果是最大似然估计量,则采样分布为高斯分布。根据Jaynes的《概率论:科学的逻辑》第202-4页,这就是高斯最初得出它的方式。{x1,...,xn}x¯


我不确定我是否理解这是正态分布的特征,因此我可能会遗漏一些东西。如果我们有iid Poisson数据并想估算怎么办?最大似然估计,但的抽样分布不是高斯-首先,必须是合理的; 其次,如果它是高斯式,也应该是。μx¯x¯x¯xiPoisson(nμ)
银鱼

2
泊松均值不是位置参数!
kjetil b halvorsen 2015年

6

Steutel和Van Harn(2004)给出了在无限可分布类中正态分布的更特殊描述。

当且仅当满足以下条件时,非退化无限可整随机变量才具有正态分布 X

lim supxlogP(|X|>x)xlog(x)=.

该结果以其尾部行为表征了正态分布。


1
所述限制的简短证明如下:如果是标准范数,则如,因此。但是因此结果如下。泊松情况的粗略草图似乎表明给定的极限是,但是我没有仔细检查。XxP(X>x)/φ(x)1xlogP(X>x)logφ(x)+logx02logφ(x)x2λ
主教

6

在图像平滑(例如比例空间)的情况下,高斯是唯一的旋转对称可分离内核。

也就是说,如果我们要求 其中,则旋转对称性要求 等效于。

F[x,y]=f[x]f[y]
[x,y]=r[cosθ,sinθ]log[f[x]]=cx
Fθ=f[x]f[y]xθ+f[x]f[y]yθ=f[x]f[y]y+f[x]f[y]x=0f[x]xf[x]=f[y]yf[y]=const.
log[f[x]]=cx

要求为适当的核,则需要常数为负且初始值为正,从而产生高斯核。f[x]


*在概率分布的情况下,可分离的意思是独立的,而在图像过滤的情况下,它允许将2D卷积在计算上减少为两个1D卷积。


2
+1但是,这不是直接从二维二维Herschel-Maxwell定理的应用中得出的吗?
ub

@whuber确实,通过该线程查看时,我不知何故设法忽略了您的答案!
变形虫说莫妮卡(Monica)恢复

@whuber是的。我没有详细阅读这个旧线程,只是根据请求添加了这个答案。
GeoMatt22

1
@amoeba也可以在这里看到。
GeoMatt22

3

Ejsmont [1]最近发表了一篇具有高斯特征的文章:

令为所有时刻的独立随机向量,其中 不退化,并让统计 的分布仅取决于,其中中的和。然后是独立的,并与零个装置和相同的正态分布对于。(X1,,Xm,Y) and (Xm+1,,Xn,Z)Xii=1naiXi+Y+Zi=1nai2aiR1m<nXi{ 1 ... Ñ }cov(Xi,Y)=cov(Xi,Z)=0i{1,,n}

[1]。埃克斯蒙特,维克多。“通过一对随机向量的独立性来表征正态分布。” 统计与概率快报114(2016):1-5。


1
这是一个微妙而迷人的特征。感谢您通过共享改进此线程!
ub

1

其特征函数具有与pdf相同的形式。我不确定是否有其他发行版可以做到这一点。


4
有关构造随机函数的特征函数与其pdf相同的方式,请参见我的答案
迪利普Sarwate

-1

期望值减去标准偏差即为该函数的鞍点。


11
可以肯定,这是正态分布的一个属性,但是它没有它的特征,因为许多其他分布也具有此属性。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.