评估主成分分析(PCA)质量的良好指标是什么?
我在数据集上执行了该算法。我的目标是减少功能数量(信息非常冗余)。我知道保留的方差百分比可以很好地表明我们保留了多少信息,是否可以使用其他信息指标来确保我删除了冗余信息并且没有“丢失”此类信息?
3
严格来说,没有“冗余”信息,除非您的初始数据是完全共线的。人们通常会看到保留了方差的百分比(“我们使用了前五个主要成分,占方差的90%”)。我对寻找替代品感兴趣。
—
Stephan Kolassa 2014年
由于您的标签之一是信息理论:评估PCA是否有效的一种间接方法是检查假设,即信息理论告诉我们在给定的尺寸缩减下信息损失低。维基说,当您的数据是高斯信号加高斯噪声的总和时,情况就是这样。en.wikipedia.org/wiki/...
—
CloseToC