推导多元正态分布的条件分布


114

我们有一个多元法向向量YN(μ,Σ)。考虑将μY划分为

μ=[μ1μ2]
Y=[y1y2]

\ Sigma的类似分区划分Σ

[Σ11Σ12Σ21Σ22]
然后,(y1|y2=a),给定第二个分区的第一个分区的条件分布为 N(μ¯,Σ¯),其均值
μ¯=μ1+Σ12Σ221(aμ2)
和协方差矩阵
Σ¯=Σ11Σ12Σ221Σ21

实际上,这些结果也已在Wikipedia中提供,但是我不知道μ¯Σ¯是如何得出的。这些结果至关重要,因为它们是推导卡尔曼滤波器的重要统计公式。有人能提供我推导μ¯\ overline {\ Sigma}的推导步骤Σ¯吗?非常感谢你!


24
这个想法是使用条件密度。您知道联合是一个双变量法线,而边际是一个法线,那么您只需要替换这些值并进行令人讨厌的代数即可。这些说明可能会有所帮助。是完整的证明。f(y1|y2=a)=fY1,Y2(y1,a)fY2(a)fY1,Y2fY2

1
您的第二个链接回答了问题(+1)。为什么不把它作为答案@Procrastinator?
gui11aume12年

1
我没有意识到这一点,但是我认为我在条件PCA中隐式使用了该方程。条件PCA需要变换被有效地计算给定A的一些选择条件协方差矩阵(IA(AA)1A)Σ
约翰

@Procrastinator-您的方法实际上需要了解Woodbury矩阵恒等式的知识以及逐块矩阵求逆的知识。这些导致不必要的复杂矩阵代数。
概率

2
@probabilityislogic实际上,结果在我提供的链接中得到了证明。但是,如果您发现它比其他方法更复杂,那是值得尊重的。另外,我没有在评论中尝试提供最佳解决方案。另外,我的评论是在Macro的回答之前发表的(正如您所看到的,我对此表示赞同)。

Answers:


111

您可以通过用蛮力显式计算条件密度来证明这一点,如评论中Procrastinator的链接(+1)所示。但是,还有一个定理说多元正态分布的所有条件分布都是正态的。因此,剩下的就是计算均值向量和协方差矩阵。我记得我们是在大学的时间序列课程中通过巧妙地定义第三个变量并使用其属性来得出结果的,而不是通过链接中的强力解决方案(只要您对矩阵代数感到满意),就可以得出该结果。我要从记忆中走出来,但这是这样的:


假设为第一个分区,为第二个分区。现在定义,其中。现在我们可以写x1x2z=x1+Ax2A=Σ12Σ221

cov(z,x2)=cov(x1,x2)+cov(Ax2,x2)=Σ12+Avar(x2)=Σ12Σ12Σ221Σ22=0

因此和是不相关的,并且由于它们是共同正常的,所以它们是独立的。现在,显然,因此得出zx2E(z)=μ1+Aμ2

E(x1|x2)=E(zAx2|x2)=E(z|x2)E(Ax2|x2)=E(z)Ax2=μ1+A(μ2x2)=μ1+Σ12Σ221(x2μ2)

这证明了第一部分。对于协方差矩阵,请注意

var(x1|x2)=var(zAx2|x2)=var(z|x2)+var(Ax2|x2)Acov(z,x2)cov(z,x2)A=var(z|x2)=var(z)

现在我们差不多完成了:

var(x1|x2)=var(z)=var(x1+Ax2)=var(x1)+Avar(x2)A+Acov(x1,x2)+cov(x2,x1)A=Σ11+Σ12Σ221Σ22Σ221Σ212Σ12Σ221Σ21=Σ11+Σ12Σ221Σ212Σ12Σ221Σ21=Σ11Σ12Σ221Σ21

这证明了第二部分。

注意:对于不熟悉此处使用的矩阵代数的人,这是一个很好的资源

编辑:此处使用的一个属性不在矩阵食谱中(好的捕获@FlyingPig)是维基百科页面上有关协方差矩阵的属性6:对于两个随机向量,对于标量,当然,但对于向量,它们在矩阵排列不同的方面有所不同。x,y

var(x+y)=var(x)+var(y)+cov(x,y)+cov(y,x)
cov(X,Y)=cov(Y,X)

感谢您的出色方法!我似乎不熟悉一个矩阵代数,在哪里可以找到打开的公式?我在您发送的链接中找不到它。var(x1+Ax2)
飞猪

@Flyingpig,不客气。我相信这是方程,再加上矩阵食谱中未写的随机向量之和的方差的附加属性-我在答案中添加了这个事实-感谢您的关注那!(291),(292)
2012年

13
这是一个很好的答案(+1),但可以根据方法的顺序进行改进。我们首先说我们想要整个向量的线性组合与独立/不相关。这是因为我们可以使用的事实,这意味着和。这些反过来导致和。这意味着我们应该采取。现在我们需要。如果是可逆的,则我们有z=Cx=C1x1+C2x2x2p(z|x2)=p(z)var(z|x2)=var(z)E(z|x2)=E(z)var(C1x1|x2)E(C1x1|x2)C1=Icov(z,x2)=Σ12+C2Σ22=0Σ22C2=Σ12Σ221
probabilityislogic

1
@jakeoung -这是不是证明是,它是将它设置为这个值,所以我们得到一个包含我们想知道的变量表达式。C1=I
概率

1
@jakeoung我也不太明白那句话。我以这种方式理解:如果,则。因此的值在某种程度上是任意标度。因此,为简单起见,我们将设置为。cov(z,x2)=0cov(C11z,x2)=C11cov(z,x2)=0C1C1=I
肯T

6

Macro的答案很好,但是这是一种甚至更简单的方法,不需要您使用任何外部定理来断言条件分布。它涉及以分隔条件语句的参数变量的形式编写Mahanalobis距离,然后相应地分解法线密度。


重写条件向量的Mahanalobis距离:此推导使用矩阵求逆公式,该公式使用Schur补码 。我们首先使用逐块求逆公式将逆方差矩阵写为:ΣS=Σ11Σ12Σ221Σ21

Σ1=[Σ11Σ12Σ21Σ22]1=[Σ11Σ12Σ21Σ22],

哪里:

Σ11=ΣS1 Σ12=ΣS1Σ12Σ221,Σ21=Σ221Σ12ΣS1Σ22=Σ221Σ12ΣS1Σ12Σ221. 

使用这个公式,我们现在可以将马哈纳洛比斯距离写成:

(yμ)TΣ1(yμ)=[y1μ1y2μ2]T[Σ11Σ12Σ21Σ22][y1μ1y2μ2]=(y1μ1)TΣ11(y1μ1)+(y1μ1)TΣ12(y2μ2)+(y2μ2)TΣ21(y1μ1)+(y2μ2)TΣ22(y2μ2)=(y1(μ1+Σ12Σ221(y2μ2)))TΣS1(y1(μ1+Σ12Σ221(y2μ2)))=(y1μ)TΣ1(y1μ),

哪里:

μμ1+Σ12Σ221(y2μ2),ΣΣ11Σ12Σ221Σ21.

注意,该结果是不假定随机向量的正态性的一般结果。它提供了一种重新构造Mahanalobis距离的有用方法,使其相对于分解中的仅一个矢量(另一种被吸收到平均矢量和方差矩阵中)为二次形式。


推导条件分布:现在,我们有了上面的Mahanalobis距离形式,剩下的就很容易了。我们有:

p(y1|y2,μ,Σ)y1p(y1,y2|μ,Σ)=N(y|μ,Σ)y1exp(12(yμ)TΣ1(yμ))=exp(12(y1μ)TΣ1(y1μ))y1N(y1|μ,Σ).

这可以确定条件分布也具有指定的条件均值向量和条件方差矩阵的多元正态分布。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.