我有许多多变量观测值,并希望评估所有变量的概率密度。假定数据是正态分布的。在低数量的变量下,一切都会按我预期的那样工作,但移至更大的数量会导致协方差矩阵变为非正定。
我已将Matlab中的问题减少为:
load raw_data.mat; % matrix number-of-values x number of variables
Sigma = cov(data);
[R,err] = cholcov(Sigma, 0); % Test for pos-def done in mvnpdf.
如果err> 0,则Sigma不是正定的。
为了评估更高维度的实验数据,我可以做些什么?它可以告诉我有关数据的任何有用信息吗?
我在这方面是个初学者,所以如果我错过了一些明显的事情,我深表歉意。