生成相关随机变量的公式如何工作?


19

如果我们有2个正常的,不相关的随机变量则可以使用以下公式创建2个相关的随机变量X1,X2

Y=ρX1+1ρ2X2

然后与的相关性为。ρ X 1YρX1

有人可以解释这个公式的来源吗?


1
stats.stackexchange.com/a/71303我的回答中出现了对此问题和相关问题的广泛讨论。除此之外,它使平原(1)态假设是无关紧要的,(2)你需要额外的假设:方差的X1X2必须按顺序相等的相关YX1ρ
ub

非常有趣的链接。我不确定我是否理解常态无关紧要。如果或不正常,则通过Kaiser-Dickman算法控制的密度变得更加困难。这是整个原因,专门的算法来产生非正常的相关数据(例如,黑德里克,2002; Ruscio&Kaczetow,2008年,淡水河谷与Maurelli,1983)例如,假设你的目标是产生X〜正常,ÿ〜制服,其中\ rho = .5。使用X_2〜均匀会导致Y不均匀(Y最终是法线和均匀的线性组合)。X 2 ý X ý ρ X 2 ÿ ÿX1X2YXYρX2YY
安东尼

@Anthony该问题仅询问相关性,它纯粹是第一刻和第二刻的函数。答案不取决于分布的任何其他属性。您正在讨论的是完全不同的主题。
ub

Answers:


17

假设您想找到X1X_2的线性组合,X2使得

corr(αX1+βX2,X1)=ρ

请注意,如果您乘两个和由相同的(非零)不变,相关性不会改变。因此,我们将添加一个条件来保留方差:β VAR α X 1 + β X 2= VAR X 1αβvar(αX1+βX2)=var(X1)

这相当于

ρ=冠状病毒αX1个+βX2X1个变种αX1个+βX2变种X1个=α冠状病毒X1个X1个=变种X1个+β冠状病毒X2X1个=0变种αX1个+βX2变种X1个=α变种X1个α2变种X1个+β2变种X2

假设两个随机变量具有相同的方差(这是一个关键的假设!)(),我们得到变种X1个=变种X2

ρα2+β2=α

该方程有很多解决方案,因此该回顾保留方差的条件了:

变种X1个=变种αX1个+βX2=α2变种X1个+β2变种X2α2+β2=1个

这导致我们

α=ρβ=±1个-ρ2

UPD。关于第二个问题:是的,这被称为美白


9

该方程是Cholesky分解的简化双变量形式。这个简化的方程有时称为Kaiser-Dickman算法(Kaiser&Dickman,1962)。

请注意,和必须具有相同的方差才能使该算法正常工作。而且,该算法通常与正常变量一起使用。如果或不正常,则的分布形式可能与。X 2 X 1 X 2 Y X 2X1个X2X1个X2ÿX2

参考文献:

Kaiser,HF,和Dickman,K。(1962)。来自任意总体相关矩阵的样本和总体评分矩阵以及相关矩阵。心理疗法,27(2),179-182。


2
我想您不需要标准化的标准变量,只要具有相同的方差就足够了。
Artem Sobolev 2015年

2
不,分布是不是一个混合物,如你要求的分布。ÿ
Dilip Sarwate 2015年

点了,@ Dilip Sarwate。如果或是非正态的,则成为两个变量的线性组合,可能不会导致所需的分布。这就是使用专用算法(而不是Kaiser-Dickman)处理生成的非正态相关数据的原因。X 2 YX1个X2ÿ
安东尼

3

如果将两个序列视为向量(数据点是向量的维),则相关系数是两个序列之间的。上面的公式只是将向量分解为其和分量(相对于)。 如果,则。Ñ ħ Ñ ħ COS θ 小号Ñ θ X 1X 2 ρ = ç ö 小号θ cosñŤHñŤHcosθs一世ñθX1个X2
ρ=CØsθ1个-ρ2=±s一世ñθ

因为如果不相关,则它们之间的角度为直角(即,尽管未标准化,也可以将它们视为正交)。X1个X2


2
欢迎来到我们的网站!我相信,如果您使用标记数学表达式,则会将您的帖子引起更多关注:将它们括在美元符号之间。编辑时有可用的帮助。ŤËX
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.