样本协方差矩阵是否总是对称且正定的?


33

计算样本的协方差矩阵时,是否可以保证得到一个对称且正定的矩阵?

目前,我的问题有一个4600个观测向量和24个维度的样本。


为了采样协方差矩阵,我使用以下公式:其中是样本数,是样本均值。Ñ ˉ XQn=1ni=1n(xix¯)(xix¯)nx¯
Morten 2013年

4
通常将其称为“计算样本协方差矩阵”,或“估计协方差矩阵”,而不是“对协方差矩阵进行采样”。
Glen_b-恢复莫妮卡

1
协方差矩阵不确定的常见情况是24个“维度”记录的混合物成分总计为100%。
ub

Answers:


41

对于向量的样本,其中,样本均值向量为 和样本协方差矩阵为 对于非零向量,我们有 因此,Q始终为正半定数xi=(xi1,,xik)i=1,,n

x¯=1ni=1nxi,
Q=1ni=1n(xix¯)(xix¯).
yRk
yQy=y(1ni=1n(xix¯)(xix¯))y
=1ni=1ny(xix¯)(xix¯)y
=1个ñ一世=1个ñX一世-X¯ÿ20

Whuber在下面的评论中给出了为正定的附加条件。如下。

定义,对于。对于任何非零,当且仅当,为零,对于每个。假设集合跨过。然后,存在实数,使得。但是然后我们有,得出,这是一个矛盾。因此,如果的跨度,则ž一世=X一世-X¯一世=1个ñÿ[Rķž一世ÿ=0一世=1个ñ{ž1个žñ}[Rķα1个αñÿ=α1个ž1个++αñžñÿÿ=α1个ž1个ÿ++αñžñÿ=0ÿ=0ž一世[Rķř 一个Ñ ķ [ Ž 1 ... Ž Ñ ] = ķ肯定的。此条件等效于。[R一种ñķ[ž1个žñ]=ķ


2
我喜欢这种方法,但建议您注意:不一定是肯定的。我对康斯坦丁(Konstantin)回答的评论中描述了达到上述条件的(必要和充分)条件。
Whuber

1
由于的秩小于或等于,因此可以将条件简化为等于k的秩。k[z1,z2,,zn]ķ
报价不能拒绝

13

一个正确的协方差矩阵总是对称正定* *明确。

两个变量之间的协方差定义为。σXÿ=Ë[X-ËXÿ-Ëÿ]

如果您切换和的位置,则该方程式不会改变。因此,矩阵必须是对称的。ÿXÿ

它也必须是正* *定的,因为:

您总是可以以协方差矩阵变为对角线的方式找到变量的变换。在对角线上,您发现变换变量的方差为零或正,很容易看出这使变换矩阵为正半定。但是,由于定义的定义是变换不变的,因此,在任何选定的坐标系中,协方差矩阵都是正半确定的。

当您使用上述公式估算协方差矩阵时(即,在计算样本协方差时),它将无效。仍然是对称的。它也必须是正半定值(我认为),因为对于每个样本,赋予每个样本点相等概率的pdf具有样本协方差作为其协方差(请验证此点),因此上述所有内容仍然适用。


1
PS:我开始认为这不是您的问题……
Konstantin Schubert

但是,如果您想知道采样算法是否可以保证,则必须说明采样方式。
康斯坦丁·舒伯特

1
Morten,对称性直接来自公式。为了显示半定性,您需要为任何向量建立。但是倍的总和(其中,从那里是的总和 =,其是向量的平方长度。因为和平方和永远不能为负,,QED。这也表明正是针对这些向量Ü Q ñ 1 / Ñ v v ' v = X - ˉ Xñ ü Q Ñ ù ' ù v v ' Ü 'Ú v Û v i ' u v i n > 0 uüñü0üñ1个/ñv一世v一世v一世=X一世-X¯ñüñüüv一世v一世üüv一世üv一世üv一世ñ>0ü Q Ñ Ù ' = 0 Ü v ü v = 0 v û = 0 Q Ñüñü0üñü=0ü与所有正交(,对于所有,)。当跨度时,则且是确定的。v一世üv一世=0一世v一世ü=0ñ
ub

1
@Morten如果您从几何上理解矩阵乘法,则变换不变性非常清晰。将您的向量视为箭头。描述向量的数字随坐标系而变化,但是向量的方向和长度却没有变化。现在,与矩阵相乘意味着您可以更改箭头的长度和方向,但是在每个坐标系中,效果在几何上都是相同的。标量积也是如此:它是几何定义的,而几何是不变变换的。因此,您的方程在所有系统中都有相同的结果。
康斯坦丁·舒伯特

1
@Morten当您考虑坐标时,参数如下所示:当是您的变换矩阵时,则:其中是变换后的坐标矢量,,因此,当您在其中变换每个元素时方程,得到,等于,并且由于A是正交的,是单位矩阵,我们再次得到,这意味着变换后的方程和未变换的方程具有相同的标量,因此它们要么均为零,要么都不为零。v ' = v v ' 中号' = 中号Ť v Ť中号v > 0 v ' Ť中号' v ' = v Ť中号Ťv > 0 v Ť Ť中号Ť A v > 0 A T A v T M v一种v=一种vv中号=一种中号一种ŤvŤ中号v>0vŤ中号v=一种vŤ一种中号一种Ť一种v>0vŤ一种Ť一种中号一种Ť一种v>0一种Ť一种vŤ中号v>0
康斯坦丁·舒伯特2013年

0

方差-协方差矩阵始终是对称的,因为可以从实际方程式中证明该矩阵的每个项。

同样,方差-协方差矩阵始终是大小为n的平方矩阵,其中n是实验中的变量数。

对称矩阵的特征向量总是正交的。

使用PCA,您可以确定矩阵的特征值,以查看是否可以减少实验中使用的变量数量。


1
Welcome Gen.请注意,您的用户名,identicon和指向用户页面的链接会自动添加到您发布的每条帖子中,因此无需签名。
Antoine Vernet

3
通过解决正定性的问题,可以改善此答案
Silverfish

这并不能真正回答这个问题:它只是可能不相关的不受支持的断言的集合。您能否以某种方式重新构造它,以显示问题的答案并解释原因?
ub

0

我将在Zen的一个很好的论证中添加以下内容,这解释了为什么我们经常说如果,协方差矩阵是正定的。ñ-1个ķ

如果是连续概率分布的随机样本,则几乎可以肯定地(在概率论的意义上)线性独立。现在,不是线性独立的,因为,而是因为是线性独立的,因此为span。如果,它们也跨越。X 1X 2X Ñ Ž 1Ž 2ž Ñ Σ Ñ = 1个 ž = 0 X 1X 2x n z 1zX1个X2XñX1个X2Xñž1个ž2žñ一世=1个ñž一世=0X1个X2Xñř ñ - 1 ñ - 1 ķ ř ķž1个ž2žñ[Rñ-1个ñ-1个ķ[Rķ

总之,如果是连续概率分布和的随机样本,则协方差矩阵是正定的。 ñ - 1 ķX1个X2Xñn-1个ķ


0

对于像我这样的非数学背景的人来说,他们并不能很快掌握抽象的数学公式,这是一个针对最受争议的答案的出色例子。协方差矩阵也可以以其他方式导出。

在此处输入图片说明

在此处输入图片说明


您能解释一下该电子表格如何显示协方差矩阵的正定性吗?
ub

它不是。我很难想象其符号形式的协方差矩阵。因此,我为自己创建了此工作表,并认为它可以帮助某人。
Parikshit Bhinde

然后,请对其进行编辑以包含问题的答案。
ub

完成:)感谢您的建议。
Parikshit Bhinde

问题是“那么是否可以保证得到一个对称且正定的矩阵?” 我无法感知您帖子中解决此问题的任何元素,因为(1)它从未标识出协方差矩阵;(2)它没有证明任何事物的正定性。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.