该SE上有许多帖子讨论了主成分分析(PCA)的可靠方法,但是我无法找到一个很好的解释,说明为什么 PCA首先对异常值敏感。
5
因为L2规范对于异常值的贡献很高。然后,当最小化L2范数时(这是PCA试图做到的),这些点将比更接近中间点的点更难拟合。
—
mathreadler '18
该答案将告诉您所需的一切。只需描绘一个异常值,然后仔细阅读即可。
—
S. Kolassa-恢复莫妮卡