如该问题所述,协方差矩阵的最大秩为,其中为样本大小,因此,如果协方差矩阵的维数等于样本大小,则该奇数为奇数。我不明白为什么我们要从协方差矩阵的最大秩中减去。n−1
如该问题所述,协方差矩阵的最大秩为,其中为样本大小,因此,如果协方差矩阵的维数等于样本大小,则该奇数为奇数。我不明白为什么我们要从协方差矩阵的最大秩中减去。n−1
Answers:
给定n个
为什么有秩,而不是排名,因为它似乎是因为我们正在总结秩矩阵?∑ziz⊤i
答案是因为不是独立的而发生。根据构造,。所以,如果你知道的的,那么最后剩下是完全确定的; 我们不求和独立秩矩阵,我们总结仅独立秩矩阵,然后再增加一个秩,充分线性由其余部分确定矩阵。最后添加的内容不会更改总体排名。zi
如果将重写为然后将其插入上面的表达式中则可以直接看到此情况:现在总和中只剩下n-1个项,很显然整个总和最多具有n-1个等级。∑zi=0
顺便说一下,该结果暗示了为什么协方差的无偏估计量中的因子是1n−1
我在上面的评论中提到的几何直觉是,始终可以将1D线拟合到2D中的任何两个点,并且可以始终将2D平面拟合到3D中的任何三个点,即子空间的维数始终为n−1
我相信,解释如下:
让我们定义矩阵 X矩阵样本的数据点,其中的 是一个数字的变量和是一个数为每个变量的样本。让我们假设所有变量都不是线性相关的。nmxnm
的等级是。xmin(n,m)
让我们定义行中心变量的矩阵 x矩阵:nmz
z=x−E[x]。
居中数据的等级变为,因为现在每个数据行都受到约束:min(n,m−1)
∑mi=1z∗i=0。
基本上,这意味着即使删除其中一列,我们也可以重新创建整个矩阵。z
样本协方差方程变为:x
cov(x,x)=1m−1zzT
显然,协方差矩阵的是。rank(zzT)
根据秩为零定理: 。rank(zzT)=rank(z)=min(n,m−1)