可以根据相关矩阵来表示PCA算法(假设数据已经被归一化,我们仅考虑投影到第一台PC上)。目标函数可以写成:
很好,我们使用拉格朗日乘子来求解,即重写为:
相当于
因此(在Mathworld上参见此处)似乎等于
但这是为了最大化点与线之间的距离,从我在这里所读的内容来看,这是不正确的-应该是,而不是\ max。我的错误在哪里?最大
或者,有人可以告诉我最大化投影空间中的方差与最小化点与线之间的距离之间的联系吗?
我认为最小距离用于满足组件的正交性标准。这些点被投影到彼此正交的PC中,但是在每个连续的组件中,剩余方差最大。
—
Michael R. Chernick
提示:当您首先考虑最小特征值而不是最大特征值时会发生什么?
—
ub
@whuber最小的特征值可能具有PC,它是最终目标函数的解决方案。但是该PC并没有最大限度地发挥原始目标功能。
—
Cam.Davidson.Pilon 2012年
我不确定您所说的“最终”和“原始”目标函数是什么意思。PCA不是(从概念上来说)优化程序。它的输出是一组主要方向,而不仅仅是一个方向。这是一个(有趣的)数学定理,可以通过求解约束二次程序序列来找到这些方向,但这并不是PCA的概念或实践的基础。我只是建议,通过关注最小的特征值而不是最大的特征值,您可以调和这两个想法:(1)最小化距离和(2)最佳化PCA。
—
ub
没关系-您的答案是我尝试做的正确版本。
—
戴维森(Cam.Davidson.Pilon),2015年