对相关矩阵特征值分布的直觉/解释?


13

您对相关矩阵特征值分布的直觉/解释是什么?我倾向于听到通常3个最大特征值最重要,而接近零的特征值则是噪声。另外,我已经看过几篇研究论文,研究自然发生的特征值分布与从随机相关矩阵计算得出的特征值分布有何不同(再次,区分信号中的噪声)。

请随时详细说明您的见解。


您是否有任何特定的应用程序介意,您是否正在寻求关于除任何应用程序外(例如,纯数学方面)还需要考虑多少个电动汽车的一般建议,还是应将其应用于特定的环境(例如因素分析, PCA等)?
chl

我对数学方面更感兴趣,即将特征值作为相关矩阵基础数据的属性。如果有必要根据具体情况对此进行讨论,也可以随意进行讨论。
Eduardas

Answers:


4

我倾向于听到通常3个最大特征值最重要,而接近零的特征值则是噪声

您可以对此进行测试。请参阅链接的纸岗位了解更多详情。同样,如果您处理的是金融时报系列,那么您可能想先校正Leptokurticity(即考虑经Garch调整后的收益系列,而不是原始收益)。

我看过一些研究论文,研究自然发生的特征值分布与从随机相关矩阵计算得出的特征值分布之间的差异(再次,区分信号中的噪声)。

爱德华:>通常,这样做的方式是相反的:查看来自所需应用程序的(相关矩阵的)特征值的多元分布。一旦确定了特征值分布的可靠候选者,就应该很容易从它们产生特征值。

如何识别特征值的多元分布的最佳过程取决于您要同时考虑多少资产(即相关矩阵的维数是多少)。如果(是资产数),则有一个巧妙的技巧。p10p

编辑(Shabbychef的评论)

四步程序:

  1. 假设您有多元数据的个子样本。您需要为每个子样本估算方差-协方差矩阵(您可以使用经典估算器,也可以使用健壮的替代方案,例如fast MCD,该模型已在matlab,SAS,S, R,...)。像往常一样,如果您处理的是金融时报系列,则需要考虑经garch调整的收益系列,而不是原始收益。j=1,...,JC~jj
  2. 对于每个子样本,计算,...,,本征值的。jΛ~j= log(λ~1j)log(λ~pj)C~j
  3. 计算,即 j个条目为的矩阵的凸包(同样,在Matlab,R,...中也很好实现) 。CV(Λ~)J×pΛ~j
  4. 从内部随机绘制点 (这是通过在每个边上赋予权重来完成的,其中,其中是来自单位指数分布的绘图(此处有更多详细信息)。瓦特 Ç V Λ瓦特 = γ CV(Λ~)wiCV(Λ~) γwi=γii=1pγiγi

局限性在于,当维数大于10时,快速计算一系列点的凸包变得非常慢J2


1
我很好奇:诀窍是什么?
shabbychef

你的意思是特征向量的 3?没有价值C~
shabbychef 2010年

没有。是标量。λ1
user603 2010年

这是一个非常奇怪的过程。它在某处出版了吗?
shabbychef

@Shabbychev:>没有,但我对相关问题的工作机会(只是没有一个涉及时间序列)前一阵子(同样的问题,因为这一个stats.stackexchange.com/questions/2572/...
user603

11

特征值给出数据传播的主要成分的大小。


(来源:yaroslavvb.com
第一个数据集是从高斯生成的,具有协方差矩阵第二个数据集是第一个旋转了数据集(3001)π/4


2

k

通常,第一个本征组合在每个名称中的权重几乎相等,也就是说,“市场”投资组合由具有相等美元权重的所有资产组成。第二本征文集可能有一些语义上的含义,具体取决于您查看的时间段:例如,大多数是能源股或银行股票等。以我的经验,您很难说出第五本征文集之外的任何故事,这在某种程度上取决于宇宙的选择和所考虑的时间段。这很好,因为通常第五个特征值大约不超过Marchenko-Pastur分布所施加的极限。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.