解释LLE(局部线性嵌入)算法的步骤?


13

我了解LLE算法背后的基本原理包括三个步骤。

  1. 通过某种度量(例如k-nn)找到每个数据点的邻域。
  2. 找到每个邻居的权重,这些权重表示邻居对数据点的影响。
  3. 根据计算出的权重构造数据的低维嵌入。

但是,在我阅读的所有课本和在线资源中,步骤2和步骤3的数学解释令人困惑。我无法解释为什么使用这些公式。

在实践中如何执行这些步骤?有没有任何直观的方式来解释所使用的数学公式?

参考:http : //www.cs.nyu.edu/~roweis/lle/publications.html

Answers:


10

局部线性嵌入(LLE)消除了估计远处对象之间距离的需要,并通过局部线性拟合恢复了全局非线性结构。LLE是有利的,因为它不涉及诸如学习率或收敛标准之类的参数。LLE还可以通过的固有维数很好地缩放。LLE的目标函数为 权重矩阵元件为对象和被如果设置为零Y

ζ(Y)=(YWY)2=Y(IW)(IW)Y
Wwijijj不是的最近邻居,否则,对象的K个最近邻居的权重通过 ,其中因变量是对象的向量,是对象所有最近邻居的 Gram矩阵,而是一个权重的向量,遵循总和约束。令为对称正半定ii
U=Gβ
UK×1GK×KiβK×1DK×K维对象所有K个最近邻的距离矩阵。可以证明等于元素为 的双中心距离矩阵 的回归系数被确定数值使用 pxiGτ
τlm=12(dlm21Kldlm21Kmdlm2+lmdlm2).
K
βK×1=(ττ)K×K1τUK×1,
并检查以确认它们合计为一。的值被嵌入到行的在对应于对象物的K最近邻的各列的位置,以及转置的元素。对数据集中的每个第个对象重复此操作。需要注意的是,如果最近的邻居数量太少,则可能会稀疏,从而导致本征分析变得困难。据观察,最近邻居导致βiWiiKWK=9W特征分析过程中不包含病理的矩阵。通过找到的最小非零特征值来最小化目标函数 的还原形式由下式表示其中具有的尺寸基于的两个最低特征值。
(IW)(IW)E=ΛDE.
XY=EEn×2Λ


“ K = 9最近的邻居”这不取决于的维数吗?例如,如果尺寸小于9,则权重矩阵不会唯一确定。这会导致LLE问题吗?YYW
斯科特,

是的,但是如果有8个维度,那么对于随机数据而言,实际上,每个点都可以以无限多种方式完美地书写为9个点的线性组合。
斯科特,

实施技术时始终存在“假设条件”场景,这就是使用参数约束的原因。
NXG Logic,
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.