我正在研究一些聚类技术,其中对于给定的d维向量簇,我假设一个多元正态分布并计算样本d维平均向量和样本协方差矩阵。
然后,当尝试确定一个新的,看不见的d维向量是否属于该簇时,我正在通过以下度量来检查其距离:
这需要我计算协方差矩阵的逆。但是给定一些样本,我不能保证协方差矩阵是可逆的,如果不是,我该怎么办?
谢谢
这取决于导致矩阵不可逆的原因。可能的原因可能是(a)用于计算协方差矩阵的样本太小(b)样本大小足够,但其成员不是从连续分布中提取的,因此样本的某些列/行重复出现。
—
user603 2013年
我认为样本量变小
—
Aly
@ Anony-Mousse我已经确保我现在至少使用与维数一样多的样本,否则矩阵将秩不足。到目前为止,没有问题,但是我认为样本协方差是不可逆的?
—
2013年
为什么总是可逆的?对于单个观察,均值等于该观察值,因此样本协方差为零矩阵,该矩阵不会求逆。我认为矩阵必须是全秩才能反转的,并且只有在样本数量> =维的情况下
—
矩阵才是
@corone要求严格>
—
user603 2013年