每个相关矩阵都是正定的吗?


11

我在这里谈论的是Pearson相关矩阵。

我经常听到它说所有相关矩阵都必须是正半定数。我的理解是,正定矩阵必须具有特征值,而正半定矩阵必须具有特征值。这使我认为我的问题可以改写为“相关矩阵的特征值吗?”>00=0

相关矩阵(根据经验数据生成,没有缺失数据)是否可能具有特征值或特征值?如果它是人口相关矩阵呢?=0<0

我在上面复读约协方差矩阵这个问题

考虑三个变量,和。它们的协方差矩阵不是正定的,因为存在一个向量(),其中不是正数。Xÿž=X+ÿ中号ž=1个1个-1个ž中号ž

但是,如果我不是使用协方差矩阵对相关矩阵进行计算,则为正。因此,我认为对于相关和协方差矩阵来说情况可能有所不同。ž中号ž

我问的原因是,我被问到了关于stackoverflow的问题。


例如,如果两个属性是一件事,只是名称不同,则矩阵是单数。如果两个属性加到一个常数上,则它再次是单数,等等
ttnphns

如果协方差矩阵是奇异的,则相关矩阵也是奇异的。
ttnphns

2
近似重复:每个相关矩阵都是正半定的吗?哪个对定角与半定角的关注较少,并且每个协方差矩阵都是正定的吗?这很重要,因为协方差本质上是重新定标的相关性。
银鱼

Answers:


16

相关矩阵不必是正定的。

考虑具有非零方差的标量随机变量X。那么X与自身的相关矩阵就是所有矩阵,都是正半定的,但不是正定的。

至于样本相关性,请考虑上述样本数据,具有第一观察值1和1,第二观察值2和2。这导致样本相关性是所有值的矩阵,因此不是正定的。

如果以精确的算术(即没有舍入误差)计算出样本相关矩阵,则其特征值不能为负。


4
可能值得一提的是缺失值对样本相关矩阵的可能影响。数字模糊不是在样本相关/协方差矩阵中获得负特征值的唯一原因。
银鱼

1
是的,我没有明确指出,但是根据问题陈述,我假设“没有数据丢失”。一旦您进入缺少数据并对其进行调整的荒唐,古怪的世界,一切都会发生。
Mark L. Stone

是的,很抱歉,您说对了,“没有数据丢失”是正确的,只是认为值得一提,因为即使OP的胃口已经满足,未来的搜索者也可能会感兴趣!
银鱼

7

通过@yoki和@MarkLStone(1至两者)都指向的是一个问题的答案人口相关矩阵可以具有零个特征值如果变量是线性相关的(诸如例如在@MarkLStone的例子和X 1 = @yoki示例中为2 X 2)。X1个=X2X1个=2X2

除此之外,如果n < p,即样本大小小于变量数量,则样本相关矩阵将必然具有零特征值。在这种情况下,协方差和相关矩阵都将不超过n - 1级,因此将至少存在p - n + 1个零特征值。请参阅为什么样本大小小于变量数时样本协方差矩阵为何奇异?为什么是协方差矩阵最多军衔ñ - 1ñ<pn1pn+1n1


真实的日期。我想我应该也应该提供此信息,但我的目标是提供一个反例来反驳OP的假设,从而表明其无效性。不过,您应该将第二句话调整为“在这种情况下,协方差和相关矩阵最多将达到n-1级,因此将至少有(PN-1)个零特征值。”
Mark L. Stone

4

Xÿ=2X(X,Y)2X=YE[Y2]=4E[X2]=σY2E[XY]=2E[X2]Cov(X,Y)=E[XY]EXEY=E[XY]

Λ=(1224),
Λ=(1111),
Xÿ

2ΛCØvXÿ=ËXÿ-ËXËÿ=2Ë[X2]=2σX2+[ËX]2ËX2=VarX+[ËX]2

d一世一个GΛ-1个/2Λd一世一个GΛ1个/2

@AntoniParellada,我不确定您的意思-这里的协方差是直接计算。但是,我将进行编辑并使其更加清晰。谢谢。
yoki 2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.