两个*相关*正态变量的总和不正常的示例


10

我知道一些相关的随机变量对的很好的例子,它们在边际上是正常的,但在联合上不是正常的。见这个答案迪利普Sarwate,和这一个红衣主教

我也知道两个总和不正常的普通随机变量的例子。见这个答案。但是在这个例子中,两个随机变量是不相关的。

是否存在两个具有非零协方差且总和不正常的普通随机变量的示例?还是有可能证明任何两个相关正态随机变量的和(即使它们不是二元正态)也必须是正态的?

[上下文:我有一个作业问题,要求的分布,其中和是具有相关标准法线。我认为该问题旨在说明它们是双变量正态的。但是我想知道,如果没有非零的额外假设,是否可以X ÿ ρ ρaX+bYXYρρ

谢谢!


5
您引用的红衣主教的答案已经包含一个解决方案:请参阅示例面板的右上角。
ub

请您能解释一下吗?他指定了一个联合分布,它产生两个正态边际。我不清楚这两个正常边际的总和不正常,这就是我所追求的。(另请参阅下面我对Glen_b答案的评论。)
mww

3
仅从图片中可以明显看出,零和的密度为零(因为线与图在一个点上的相交,该点的度量为零),而和本身也显然是对称的零,表示零是总和分布的中心。这样的分布不能为正态分布,因为正态分布的中心密度为非零。x+y=0
ub

Answers:


12

几乎所有的双变量语系都会产生一对具有一些非零相关性的正常随机变量(有些会给出零,但它们是特殊情况)。它们中的大多数(几乎全部)将产生非正常的总和。

在一些copula家族中,可以产生任何期望的(种群)Spearman相关性。困难仅在于找到正常边距的皮尔逊相关性;从原理上讲这是可行的,但代数通常可能相当复杂。[但是,如果您具有总体Spearman相关性,则在许多情况下,至少对于像高斯这样的轻尾边缘,Pearson相关性可能相距太远。]

除基数的前两个示例外,所有示例均应给出非正态和。


一些示例-前两个都与红衣主教的示例双变量分布中的第五个来自同一系系,第三个是简并的。

范例1:

克莱顿copula()θ=0.7

正态边界直方图,非正态和与二元分布图

在这里,总和非常明显地达到峰值,并且非常偏右

 

范例2:

克莱顿copula()θ=2

正态边界直方图,非正态和与二元分布图

在这里,总和略微偏斜。万一这不是所有人都知道的情况,在这里我翻转分布(即,我们用浅紫色显示的直方图)并将其叠加,这样我们可以更清楚地看到不对称性:(x+y)

x + y和-(x + y)的叠加直方图

 

我们可以很容易地互换的偏度总和的方向,这样的负相关性与左侧歪斜的正相关关系对了歪斜(例如,通过采取和在每个在上述情况下-新变量的相关性与以前相同,但总和的分布将在0左右翻转,从而改变了偏度。Y = YX=XY=Y

另一方面,如果我们只对其中之一取反,则将偏斜强度与相关符号(而不是相关方向)之间的关联更改。

值得一试的是使用一些不同的copula,以了解二元分布和正态余量会发生什么。

可以对带有t-copula的高斯边距进行实验,而不必担心copula的细节(从相关的双变量t生成,这很容易,然后通过概率积分变换将其转换为均匀的边距,然后通过逆法线cdf)。它将具有非正常但对称的和。因此,即使您没有好的copula软件包,您仍然可以相当轻松地做一些事情(例如,如果我试图在Excel中快速显示示例,则可能会从t-copula开始)。

-

示例3:(这更像是我最初应该开始的内容)

考虑一个基于标准统一的系动词,让表示而表示。结果对于和具有均匀的边距,但是双变量分布是退化的。将两个边距都转换为正常的,我们得到的分布如下:V = û 0 ù < 1UV=U V=30U<121V=32UÙVX=Φ-1Ûÿ=Φ-1V12U1UVX=Φ1(U),Y=Φ1(V)X+Y

在此处输入图片说明

在这种情况下,它们之间的相关性约为0.66。

同样,和是具有(在这种情况下,显然是)非正规和的正态相关的-因为它们不是双变量正态。ÿXY

[可以通过翻转的中心(在中生成的),得到。这些将在0处有一个尖峰,然后在其两侧各有一个间隙,并带有正常的尾巴。]1UÇ[01(12c,12+c)cV[0,12]V


一些代码:

library("copula")
par(mfrow=c(2,2))

# Example 1
U <- rCopula(100000, claytonCopula(-.7))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
       col=rgb(0,100,0,70,maxColorValue=255),
       main="Bivariate distribution")
text(-3,-1.2,"cor = -0.68")
text(-2.5,-2.8,expression(paste("Clayton: ",theta," = -0.7")))

第二个例子:

#--
# Example 2:
U <- rCopula(100000, claytonCopula(2))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
    col=rgb(0,100,0,70,maxColorValue=255),
    main="Bivariate distribution")
text(3,-2.5,"cor = 0.68")
text(2.5,-3.6,expression(paste("Clayton: ",theta," = 2")))
#
par(mfrow=c(1,1))

第三个示例的代码:

#--
# Example 3:
u <- runif(10000)
v <- ifelse(u<.5,u,1.5-u)
x <- qnorm(u)
y <- qnorm(v)
hist(x+y,n=100)

谢谢-但是,如果我没记错的话,也很正常。(当,我们得到,而当,我们得到,因此以概率1,我们得到两个独立的标准法线的总和,这是正常的。)的情况下后我总和而不是关节分布不正常的情况是两个相关法线中的一个是不正常的。I = 0 U + V I = 1 2 ZX+Y=2IZ+(1I)U+(1I)VI=0U+VI=12Z
mww

完全正确-通过各种尝试制作一个非二元正态的示例,我可以选择相关性,沿着这条线的某个地方,我停止检查和不正常。我将用一个演示非正常总和的示例替换该示例,但是它不能直接选择。等等,我可能要花一个小时左右的时间。ρ
Glen_b-恢复莫妮卡2014年

我已使用Clayton
copulas

很棒-谢谢!特别感谢R代码。
mww

我添加了第三个示例,最后,我概述了一种获得类似于我最初尝试的方式的方法-一种获得-1和1之间可调关系的方法(除了末尾的特殊情况),但是为此总和是不正常的。
Glen_b-恢复莫妮卡2014年

-1

我想出了一个例子。X是标准正态变量,Y = -X。然后X + Y = 0,这是恒定的。任何人都可以确认这是一个反例吗?

我们知道X,Y共同是正态的事实,那么它们的总和也是正态的。但是,如果它们的相关性是-1呢?

我对此有些困惑。谢谢。


当X = Y然后XY = 0时,您会得到同样的结果。这些是非二元正态分布的正态分布。因此,不需要应用适用于二元法线的法线的线性组合的性质。
Michael R. Chernick '18

@Zirui IMO它是正常的简并情况(),而不是直接的反例,尽管它取决于您的定义。σ0
Glen_b-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.