我了解LLE算法背后的基本原理包括三个步骤。
- 通过某种度量(例如k-nn)找到每个数据点的邻域。
- 找到每个邻居的权重,这些权重表示邻居对数据点的影响。
- 根据计算出的权重构造数据的低维嵌入。
但是,在我阅读的所有课本和在线资源中,步骤2和步骤3的数学解释令人困惑。我无法解释为什么使用这些公式。
在实践中如何执行这些步骤?有没有任何直观的方式来解释所使用的数学公式?
我了解LLE算法背后的基本原理包括三个步骤。
但是,在我阅读的所有课本和在线资源中,步骤2和步骤3的数学解释令人困惑。我无法解释为什么使用这些公式。
在实践中如何执行这些步骤?有没有任何直观的方式来解释所使用的数学公式?
Answers:
局部线性嵌入(LLE)消除了估计远处对象之间距离的需要,并通过局部线性拟合恢复了全局非线性结构。LLE是有利的,因为它不涉及诸如学习率或收敛标准之类的参数。LLE还可以通过的固有维数很好地缩放。LLE的目标函数为
权重矩阵元件为对象和被如果设置为零
不是的最近邻居,否则,对象的K个最近邻居的权重通过
,其中因变量是对象的向量,是对象所有最近邻居的 Gram矩阵,而是一个权重的向量,遵循总和约束。令为对称正半定维对象所有K个最近邻的距离矩阵。可以证明等于元素为
的双中心距离矩阵
的回归系数被确定数值使用
并检查以确认它们合计为一。的值被嵌入到行的在对应于对象物的K最近邻的各列的位置,以及转置的元素。对数据集中的每个第个对象重复此操作。需要注意的是,如果最近的邻居数量太少,则可能会稀疏,从而导致本征分析变得困难。据观察,最近邻居导致特征分析过程中不包含病理的矩阵。通过找到的最小非零特征值来最小化目标函数
的还原形式由下式表示其中具有的尺寸基于的两个最低特征值。