您对相关矩阵特征值分布的直觉/解释是什么?我倾向于听到通常3个最大特征值最重要,而接近零的特征值则是噪声。另外,我已经看过几篇研究论文,研究自然发生的特征值分布与从随机相关矩阵计算得出的特征值分布有何不同(再次,区分信号中的噪声)。
请随时详细说明您的见解。
您对相关矩阵特征值分布的直觉/解释是什么?我倾向于听到通常3个最大特征值最重要,而接近零的特征值则是噪声。另外,我已经看过几篇研究论文,研究自然发生的特征值分布与从随机相关矩阵计算得出的特征值分布有何不同(再次,区分信号中的噪声)。
请随时详细说明您的见解。
Answers:
我倾向于听到通常3个最大特征值最重要,而接近零的特征值则是噪声
您可以对此进行测试。请参阅链接的纸本岗位了解更多详情。同样,如果您处理的是金融时报系列,那么您可能想先校正Leptokurticity(即考虑经Garch调整后的收益系列,而不是原始收益)。
我看过一些研究论文,研究自然发生的特征值分布与从随机相关矩阵计算得出的特征值分布之间的差异(再次,区分信号中的噪声)。
爱德华:>通常,这样做的方式是相反的:查看来自所需应用程序的(相关矩阵的)特征值的多元分布。一旦确定了特征值分布的可靠候选者,就应该很容易从它们产生特征值。
如何识别特征值的多元分布的最佳过程取决于您要同时考虑多少资产(即相关矩阵的维数是多少)。如果(是资产数),则有一个巧妙的技巧。
编辑(Shabbychef的评论)
四步程序:
局限性在于,当维数大于10时,快速计算一系列点的凸包变得非常慢
特征值给出数据传播的主要成分的大小。
(来源:yaroslavvb.com)
第一个数据集是从高斯生成的,具有协方差矩阵第二个数据集是第一个旋转了数据集