为什么协方差矩阵的秩最多为?


17

问题所述,协方差矩阵的最大秩为,其中为样本大小,因此,如果协方差矩阵的维数等于样本大小,则该奇数为奇数。我不明白为什么我们要从协方差矩阵的最大秩中减去。n1n1nn11nn


1
为了获得直觉,请考虑3D中的点。这些点所在的子空间的维数是多少?您可以将它们放在一条直线上(一维子空间)吗?还是需要一个平面(2D子空间)?n=2n=2
变形虫说恢复莫妮卡

因此,您确实知道导致秩1协方差矩阵吗?好吧,让我们取分。您是否可以始终将它们安装在2D平面上?n=2n=2n=3n=3
变形虫说恢复莫妮卡

4
@amoeba您的示例很清楚,但我不明白您的示例中拟合超平面与协方差矩阵之间的关系是什么?
user3070752

抱歉抱歉延迟;)
user3070752 '16

Answers:


20

给定n个n数据点中的样本协方差矩阵的无偏估计量是其中是所有点的平均值。让我们将(\ x_i- \ bar \ x)表示\ newcommand {\ z} {\ mathbf z} \ z_i。所述\压裂{1} {N-1}的因素不改变级别,并在总和每个术语具有(根据定义)秩1,因此,问题的核心如下:xiRdxiRdC=1n1ni=1(xiˉx)(xiˉx),

C=1n1i=1n(xix¯)(xix¯),
ˉx=xi/nx¯=xi/n(xiˉx)(xix¯)zizi1n11n111

为什么有秩,而不是排名,因为它似乎是因为我们正在总结秩矩阵?zizizizin1n1nnnn11

答案是因为不是独立的而发生。根据构造,。所以,如果你知道的的,那么最后剩下是完全确定的; 我们不求和独立秩矩阵,我们总结仅独立秩矩阵,然后再增加一个秩,充分线性由其余部分确定矩阵。最后添加的内容不会更改总体排名。zizizi=0zi=0n1n1ziziznznnn11n1n11111

如果将重写为然后将其插入上面的表达式中则可以直接看到此情况:现在总和中只剩下n-1个项,很显然整个总和最多具有n-1个等级zi=0zi=0zn=n1i=1zi,

zn=i=1n1zi,
ni=1zizi=n1i=1zizi+(n1i=1zi)zn=n1i=1zi(zizn).
i=1nzizi=i=1n1zizi+(i=1n1zi)zn=i=1n1zi(zizn).
n1n1n1n1

顺便说一下,该结果暗示了为什么协方差的无偏估计量中的因子是1n11n1而不是1n1n

我在上面的评论中提到的几何直觉是,始终可以将1D线拟合到2D中的任何两个点,并且可以始终将2D平面拟合到3D中的任何三个点,即子空间的维数始终为n1n1 ; 这仅起作用,因为我们假定可以“移动”该线(和平面)以适合我们的点。将这条线(或平面)“定位”以使其穿过ˉx相当于在上述代数参数中居中。


0

我相信,解释如下:

让我们定义矩阵 X矩阵样本的数据点,其中的 是一个数字的变量和是一个数为每个变量的样本。让我们假设所有变量都不是线性相关的。nmxnm

的等级是。xmin(n,m)

让我们定义行中心变量的矩阵 x矩阵:nmz

z=xE[x]

居中数据的等级变为,因为现在每个数据行都受到约束:min(n,m1)

mi=1zi=0

基本上,这意味着即使删除其中一列,我们也可以重新创建整个矩阵。z

样本协方差方程变为:x

cov(x,x)=1m1zzT

显然,协方差矩阵的是。rank(zzT)

根据秩为零定理: 。rank(zzT)=rank(z)=min(n,m1)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.