是否可以具有联合分布不是高斯的一对高斯随机变量?


91

有人在求职面试中问我这个问题,我回答说,他们的联合分布始终是高斯分布。我以为我总是可以用它们的均值,方差和协方差写一个二元高斯函数。我想知道是否存在两个高斯的联合概率不是高斯的情况?


4
维基百科的另一个例子。当然,如果变量是独立的并且是边际高斯的,则它们是联合高斯的。

Answers:


138

二元正态分布是例外,而不是规则!

重要的是要认识到,具有正态边际的“几乎所有”关节分布不是二元正态分布。也就是说,通常的观点认为,具有非二元正态的正态边界的联合分布某种程度上是“病理性的”,这是错误的。

当然,由于多元法线在线性变换下的稳定性非常重要,因此在应用中引起了广泛的关注。

例子

从一些示例开始很有用。下图包含六个双变量分布的热图,所有分布具有标准正态边界。第一行中的左侧和中间是双变量法线,其余的不是(应显而易见的)。它们将在下面进一步描述。

具有标准正态边际的双变量分布示例。

copulas的裸露的骨头

依赖的属性通常使用copulas进行有效分析。甲二元系动词仅仅是在单位正方形的概率分布看上名称均匀的边缘人。[0,1]2

假设是一个二元变量。然后,立即从上述情况,我们知道,Ç Û v 0Ç Û 1 = ùÇ 1 v = v,例如。C(u,v)C(u,v)0C(u,1)=uC(1,v)=v

我们可以通过对双变量copula进行简单转换,在具有预定边际的欧几里得平面上构建双变量随机变量。设F 2为一对随机变量X Y )的边际分布。然后,如果C u v 是一个二元copula,则 F x y = C F 1x F 2y F1F2(X,Y)C(u,v)

F(x,y)=C(F1(x),F2(y))
是具有边际F 2的双变量分布函数。要查看最后一个事实,只需注意 相同的参数适用于。F1F2
P(Xx)=P(Xx,Y<)=C(F1(x),F2())=C(F1(x),1)=F1(x).
F2

对于连续的和,Sklar定理断言一个相反的含义,即唯一性。也就是说,给定具有连续边际,的双变量分布,相应的语系是唯一的(在适当的范围空间上)。F 2 F x y F 1 F 2F1F2F(x,y)F1F2

二元正态异常

Sklar定理告诉我们(基本上),只有一个copula产生双变量正态分布。恰当地命名为高斯系,其密度为 其中分子是在和处评估的具有相关性的双变量正态分布。[0,1]2

cρ(u,v):=2uvCρ(u,v)=φ2,ρ(Φ1(u),Φ1(v))φ(Φ1(u))φ(Φ1(v)),
ρΦ1(u)Φ1(v)

但是,还有许多其他系动词,并且将使用上一节中描述的变换给出具有正态边际的双变量分布,而不是双变量正态。

有关示例的一些细节

请注意,如果是具有密度任意 copula ,则在变换下对应的具有标准正态边际的双变量密度是 C(u,v)c(u,v)F(x,y)=C(Φ(x),Φ(y))

f(x,y)=φ(x)φ(y)c(Φ(x),Φ(y)).

注意,通过在上述方程式中应用高斯copula,我们恢复了二元法向密度。但是,对于任何其他选择,我们不会。c(u,v)

图中的示例构造如下(遍历每一行,一次一列):

  1. 具有独立分量的双变量正态。
  2. 变量正态。ρ=0.4
  3. Dilip Sarwate 在此答案给出示例。它可以容易地看到由连接函数来诱导与密度。C(u,v)c(u,v)=2(1(0u1/2,0v1/2)+1(1/2<u1,1/2<v1))
  4. 根据参数从Frank copula生成。θ=2
  5. 从具有参数的Clayton copula生成。θ=1
  6. 由参数的Clayton copula的不对称修改生成。θ=3

7
+1表示二元正态密度是例外情况!
Dilip Sarwate 2012年

也许我错过了一些东西,但是如果我们从,则将自动定义联合分布,而与任何copula构造无关,并且如果我们应用非对它们的CDF进行高斯copula构造,的确是,我们将获得非高斯CDF,但是此函数通常不会是我们开始的一对随机变量的CDF,对吧?X1,X2N(0,1)(X1,X2)F(x1,x2)X,X2
RandomGuy

如右下图所示的模拟示例: library(copula) kcf <- khoudrajiCopula(copula2 = claytonCopula(6), shapes = fixParam(c(.4, 1), c(FALSE, TRUE))) # force normal margins evil <- mvdc(kcf, c("norm", "norm"), list(list(mean = 0, sd =1), list(mean = 0, sd = 1))) contour(evil, dMvdc, xlim = c(-3, 3), ylim=c(-3, 3))
半点通过

1
@RandomGuy,您缺少一个未声明的假设,即。如果假设它们是独立的,那么是的,您已经知道联合分配。在没有独立性假设的情况下,知道边际分布不会提供足够的信息来指定联合分布。X1,X2independentN(0,1)
MentatOfDune

25

确实,多元正态向量的每个元素本身都是正态分布的,您可以推断出它们的均值和方差。但是,并非两个瓜斯随机变量都是联合正态分布的。这是一个例子:

编辑:响应于关于可以将点质量的随机变量视为的正态分布变量的共识,我将更改示例。σ2=0


令且,其中是随机变量。也就是说,每个概率为。XN(0,1)Y=X(2B1)BBernoulli(1/2)Y=±X1/2

我们首先证明具有标准正态分布。Y根据总概率定律

P(Yy)=12(P(Yy|B=1)+P(Yy|B=0))

下一个,

P(Yy|B=0)=P(Xy)=1P(Xy)=1Φ(y)=Φ(y)

其中是标准普通CDF。同样,Φ

P(Yy|B=1)=P(Xy)=Φ(y)

因此,

P(Yy)=12(Φ(y)+Φ(y))=Φ(y)

因此,的CDF 是,因此。YΦ()YN(0,1)

现在我们证明不是联合正态分布。X,Y正如@cardinal所指出的,多元正态的一个特征是其元素的每个线性组合都是正态分布的。没有此属性,因为X,Y

Y+X={2Xif B=10if B=0.

因此,是随机变量和点质量为0 的混合物,因此不能正态分布。Y+X50/50N(0,4)


4
我不同意这个答案。处的简并点质量通常被认为是具有零方差的简并高斯随机变量。同样,虽然是勉强连续的,但它们并不是共同连续的。有关两个联合连续随机变量的示例,这些变量是边际高斯的,但不是联合高斯的,请参见此答案的后半部分。1μ(X,X)
Dilip Sarwate

4
@DilipSarwate,问题是给出两个正态分布的变量(如果存在)的示例(如果存在),但它们的联合分布不是多元正态分布。这是一个例子。正态分布的大多数标准定义(例如wikipedia en.wikipedia.org/wiki/Normal_distribution)都要求方差严格为正,因此不包括点质量作为正态分布族的一部分。
2012年

4
多元高斯的标准特征是是多元高斯,当且仅当是所有高斯。正如@Dilip暗示的那样,值得考虑的是您的示例是否正确。XRnaTXaRn
红衣主教2012年

6
既然您显然不喜欢对理性的呼吁;-),那么对权威的呼吁又如何呢?(这是一个玩笑,如果是看不出来的。)在此我刚好纯属偶然,因为我一直在寻找别的东西了:例2.4,GAF Seber和AJ李,第22页线性回归分析,第2位。编,威利。它引用:“让并把 ...因此具有多元正态分布。” YN(μ,σ2)Y=(Y,Y)Y
红衣主教

5
讨论是关于定义的。显然,如果按定义要求协方差矩阵必须是非奇数的,则Macro提供了一个示例,但是根据@cardinal引用的更为宽松的定义,这也不是示例。选择更宽松的定义的一个很好的理由是,所有正常变量的线性变换都是正常的。特别地,在具有正态误差的线性回归中,残差具有联合正态分布,但协方差矩阵是奇异的。
NRH 2012年

5

以下文章包含一个证明的概述,以给出主要思想并帮助您入门。

令为两个独立的高斯随机变量,令为 z=(Z1,Z2)x=(X1,X2)

x=(X1X2)=(α11Z1+α12Z2α21Z1+α22Z2)=(α11α12α21α22)(Z1Z2)=Az.

每个,但是由于它们都是相同独立r.vs的线性组合,因此它们是共同依赖的。XiN(μi,σi2)

定义 一对r.vs是二元正态分布的,前提是可以将其写为独立正态r.vs的线性组合。x = A z z = Z 1Z 2x=(X1,X2)x=Azz=(Z1,Z2)

引理 如果是双变量高斯变量,则它们的任何其他线性组合还是普通的随机变量。x=(X1,X2)

证明。琐碎,跳过不冒犯任何人。

属性 如果不相关,则它们是独立的,反之亦然。X1,X2

分配X1|X2

假定与以前的高斯r.vs相同,但为简单起见,我们假设它们具有正方差,且均值为零。X1,X2

如果是跨越的子空间,则让和。SX2X1S=ρσX1σX2X2X1S=X1X1S

X1和是线性组合,因此也是如此。他们是高斯人,不相关(证明)并且独立。X2zX2,X1S

分解 与

X1=X1S+X1S
E[X1|X2]=ρσX1σX2X2=X1S

V[X1|X2]=V[X1S]=E[X1ρσX1σX2X2]2=(1ρ)2σX12.

然后

X1|X2N(X1S,(1ρ)2σX12).

如果条件则两个单变量高斯随机变量共同为高斯和也是高斯的。X | Y Y | XX,YX|YY|X


2
尚不清楚这种观察如何回答这个问题。由于乘积规则实际上是条件分布的定义,所以它对双正态分布并不特殊。随后的语句“然后按顺序排列……”并没有提供任何理由:到底为什么条件分布也必须是正态?
whuber

哇,我在回答一个主要问题:“我想知道是否存在这样一种情况,即两个高斯的联合概率不是高斯吗?”。因此,答案是:当条件不正常时。-辅助
辅助

2
你能完成那个示范吗?目前,这只是您的断言,没有证据。一点也不明显是正确的。它也是不完整的,因为您需要确定存在性:也就是说,您必须证明联合分布实际上可能具有正态边际,但至少有一个条件是非正态的。现在,实际上这是很简单的,因为您可以自由更改一组零值上的双正态的每个条件分布,而无需更改其边际值,但是这种可能性似乎与您的主张相矛盾。
whuber

嗨@whuber,我希望这会有所帮助。您有任何建议或修改吗?我写得很快,因为目前我没有太多的闲暇时间:-),但是我很重视您可以提出的任何建议或改进。最佳
辅助

(1)您想证明什么?(2)因为问题询问何时具有高斯边际的分布不是共同的高斯分布,所以我看不出该论证如何导致任何相关的问题。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.