PCA,ICA和Laplacian特征图


11

我对拉普拉斯特征图方法非常感兴趣。目前,我正在使用它来缩小我的医疗数据集的尺寸。

但是,使用该方法遇到了问题。

例如,我有一些数据(光谱信号),并且可以使用PCA(或ICA)来获取一些PC(或IC)。问题是如何使用LE获得原始数据的类似降维分量?

根据拉普拉斯特征图方法,我们需要解决广义特征值问题,即

Ly=λDy

此处y是特征向量。如果我绘制例如前3个特征向量(根据3个特征值的解),结果将无法解释。

但是,当我绘制前3个PC和前3个IC时,结果似乎总是(直观地)代表原始数据x

我认为原因是因为矩阵L由权重矩阵(邻接矩阵W)定义,并且数据x已与热核拟合以创建W,这是使用指数函数。我的问题是如何检索x的简化分量(而不是矩阵L的特征向量y)?L


数据

我的数据集受到限制,并且不容易演示该问题。在这里,我创建了一个玩具问题,以显示我的意思和想要问的问题。

请看图片

首先,我创建了一些以红色曲线显示的正弦波A,B,C(图的第一列)。A,B和C具有1000个样本,换句话说,保存在1x1000向量中。

其次,我使用随机创建的线性组合(例如混合源A,B,,其中是随机值。混合信号处于非常高的维空间中,例如,,1517是随机选择的高维空间。我仅以绿色曲线显示信号M的前三行(该图的第二列)。M=r1A+r2B+r3Cr1,r2,r3MMR1517×1000

接下来,我运行PCA,ICA和Laplacian特征图以获取降维结果。我选择使用3台PC,3个IC和3个LE进行公平比较(蓝色曲线分别显示为该图的第3列,第4列和最后一列)。

从PCA和ICA的结果(图的第3列,第4列),我们可以将结果解释为某种尺寸的减小,即,对于ICA结果,我们可以通过恢复混合信号(我不确定我们是否也可以通过PCA结果获得,但结果对我来说似乎很合适)。M=b1IC1+b2IC2+b3IC3M=a1PC1+a2PC2+a3PC3

但是,请查看LE的结果,我几乎无法解释结果(该图的最后一列)。减少的组件似乎有些“错误”。另外,我想提一提的是,最后一列的最后情节的特征向量式yLy=λDy

你们有更多的想法吗?

图1使用12个最近的邻居并且加热内核中的sigma为0.5: 从左到右的列:原始信号,混合信号,PC,IC,LE

图2在加热内核中使用1000个最近邻居和sigma为0.5: 从左到右的列:原始信号,混合信号,PC,IC,LE

源代码:带有所需软件包的Matlab代码


2
x的减少分量是什么意思?您是说x的低维嵌入吗?
灵车

这听起来很有趣。您能否更详细地说明实际上您的数据是什么样子?
Placidia

Answers:


4

问题的答案由原始Laplacian特征图谱第6页底部的映射给出

xi(f1(i),,fm(i))

因此,例如,点嵌入(例如,前2个“分量”)由,其中和是对应于两个最小非零特征值的特征向量根据广义特征值问题。x5(f1(5),f2(5))f1f2Lf=λDf

请注意,与PCA不同,要获得样本外嵌入并非易事。换句话说,您可以获得在计算时已经考虑过的点的嵌入,但如果是新点则不能(轻松)获得。如果您对后者感兴趣,请查阅本白皮书L


对于您将变量视为变量,我有些困惑。据我了解,您的矩阵包含来自1000维空间的1517个样本。当您在此矩阵上执行PCA(或ICA)时,您可以很好地恢复基础的变异模式:例如,在图中的第3列中,第1,2,3行对应于基数C,A,B分别。这很有道理。但是,在您的代码中,当您执行LEM时,会在()上调用该函数,这与上面的不一致。MMTmixedSignal'
珊塔努

那么,首先,在矩阵,您的变量是什么,您的观察结果是什么?其次,从您的分析看来,您不仅在寻找使用LEM 嵌入功能,而且还在寻找与PCA中的特征向量等效的功能,对吗?您无法执行此LEM,至少不容易做到。阅读本文以了解原因。MM
珊塔努

如果您要查找的只是嵌入,则可以通过映射轻松获得。查找我的答案以获取详细信息。在您的代码中,更改第47行,并使用而不是其转置。结果将为您提供1517点的3维嵌入。xi(f1(i),,fm(i))mixedSignalmappedX
珊塔努

PS:在上面,我的意思是“ 至少不能轻易使用 LEM 来做到这一点”。
Shantanu


1

与PCA不同,拉普拉斯特征图使用对应于最小特征值的广义特征向量。它跳过具有最小特征值(可以为零)的特征向量,并使用与接下来的几个最小特征值对应的特征向量。PCA是使用内核/克矩阵保留的最大方差嵌入。关于组合图拉普拉斯算子,拉普拉斯特征图被更多地看作是一个最小化问题(请参阅Trosset的论文)。


有兴趣的人请再看看我的问题。我举了一些例子。非常感谢。
萨莫(Samo Jerom)2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.