具有线性内核的内核PCA是否等于标准PCA?


Answers:


27

简介:具有线性内核的内核PCA完全等同于标准PCA。

令为大小的居中数据矩阵,列中有变量,行中有数据点。然后,协方差矩阵由,其特征向量是主轴,特征值是PC方差。同时,可以考虑所谓的革兰氏矩阵的的的大小。很容易看出,它具有直到因子相同的特征值(即PC方差),并且其特征向量是按单位范数缩放的主成分。 Ñ × d d Ñ d × d XX /ñ - 1 X X Ñ × Ñ ñ - 1XN×DDND×DXX/(n1)XXN×Nn1

这是标准PCA。现在,在内核PCA中,我们考虑一些函数,它将每个数据点映射到另一个通常具有较大维甚至可能是无限大的向量空间。内核PCA的想法是在这个新领域中执行标准PCA。D n e wϕ(x)Dnew

由于此新空间的维数很大(或无穷大),因此很难或不可能计算协方差矩阵。但是,我们可以将第二种方法应用于上面概述的PCA。实际上,革兰氏矩阵仍将具有相同的可管理 ×大小。该矩阵的元素由,我们将其称为内核函数K(\ mathbf {x} _i,\ mathbf {x} _j) = \ phi(\ mathbf {x} _i)\ phi(\ mathbf {x} _j)。这就是所谓的内核技巧:实际上不需要计算\ phi(),而只需计算K()。这个Gram矩阵的特征向量将是目标空间中我们感兴趣的主要成分。ϕ x iϕ x jK x ix j= ϕ x iϕ x jN×Nϕ(xi)ϕ(xj)K(xi,xj)=ϕ(xi)ϕ(xj)ϕ()K()

您的问题的答案现在变得显而易见。如果,则内核Gram矩阵减小为,它等于标准Gram矩阵,因此主要组成部分不会改变。K(x,y)=xyXX

一个非常易读的参考文献是Scholkopf B,Smola A和MüllerKR,《内核主成分分析》,1999年,并注意到例如在图1中,他们明确地将标准PCA称为使用点积作为内核函数的标准PCA:

内核PCA


是你的答案里的那些照片吗?有书吗?
Pinocchio 2015年

@Pinocchio,该图取自Scholkopf等人。我的答案中引用和链接的论文。
变形虫说莫妮卡(

“很容易看出,它具有相同的特征值(即PC方差),直到n-1个因子 ”-难道这并不意味着它们不完全相等吗?假设我有一个矩阵,其中n = 10个样本,d = 200维。如果需要,在标准PCA中我可以将数据投影到199个维度,但是在具有线性内核的内核PCA中,我最多只能将10个维度投影。
Cesar

1
@Cesar,不,如果您有n = 10个样本,则协方差矩阵的等级将为10-1 = 9,而标准PCA将仅找到9维(以及内核PCA)。参见此处:stats.stackexchange.com/questions/123318
变形虫说莫妮卡(Monica)恢复

我的Scholkopf B,Smola A和MüllerKR的参考链接找不到文件。
可能

5

除了变形虫的好答案之外,还有一种更简单的方法来查看其等效性。再次让为大小的数据矩阵,其中列为变量,数据点为行。标准PCA对应于取矩阵的奇异值分解X = û Σ V 与的主要组分。线性核的奇异值分解具有相同的左奇异矢量,因此具有相同的主成分。XN×DDNX=UΣVUXXX=UΣ2U


对于标准PCA,我认为我们很关心协方差矩阵的SVD,所以真的不了解X的SVD有何相关性,请您扩展一下?
m0s

@ m0s对于PCA,我们关心协方差矩阵的特征分解,通常通过(居中的)数据矩阵的SVD执行协方差矩阵的特征分解。
MrDrFenner '18

1

在我看来,具有线性核的KPCA应该与简单的PCA相同。

您将要获得特征值的协方差矩阵是相同的:

linearKPCAmatrix=1lj=1lK(xj,xj)=1lj=1lxjxjT=PCAmatrix

您可以在此处查看更多详细信息。


3
您的回答在本质上是正确的,但公式看起来令人困惑。KPCA使用Gram矩阵,而不使用协方差矩阵(对于许多非线性内核,由于目标空间具有无限维数,因此实际上不可能计算协方差矩阵)。请参见您引用的论文的第2页。K(xi,xj)
变形虫说恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.