我正在尝试决定是否保留PCA的组件。根据特征值的大小,有无数的标准,例如在此处或此处进行描述和比较。
但是,在我的应用程序中,我知道与最大(st)特征值相比,最小(最大)特征值会很小,并且基于幅度的标准都将拒绝最小(最大)特征值。这不是我想要的。我感兴趣的是:在某种意义上,是否有已知方法考虑到小特征值的实际对应部分:是真的“所有”教科书中都暗含了“只是”噪声,还是存在某种“潜在”东西?还剩利息吗?如果确实是噪声,则将其除去,否则不管特征值的大小如何都应将其保留。
对于我找不到的PCA中的组件,是否存在某种已建立的随机性或分布测试?还是有人知道这是一个愚蠢的主意吗?
更新资料
在两个用例中,组件的直方图(绿色)和法线近似值(蓝色):一次可能是真正的噪声,一次可能不是“仅”噪声(是的,值很小,但可能不是随机的)。在两种情况下,最大的奇异值都是〜160,最小的奇异值是0.0xx-对于任何截止方法来说都太小了。
我正在寻找的是一种正规化此方法的方法...