假设PCA始终旋转坐标轴,那么“旋转”和“未旋转”的主要成分是什么?


13

据我了解,主要成分是通过旋转坐标轴使其与最大方差方向对齐来获得的。

不过,我一直在阅读有关“未旋转的主成分”的信息,而我的统计软件(SAS)为我提供了varimax旋转的主成分以及未旋转的主成分。在这里,我很困惑:当我们计算主成分时,轴已经旋转了。那为什么还需要轮换呢?“未旋转的主要成分”是什么意思?


1
仅仅关于软件如何工作的问题不在这里,但是您可能在这里埋藏着一个真正的统计问题。您可能需要编辑问题以阐明潜在的统计问题。您可能会发现,当您了解所涉及的统计概念时,特定于软件的元素是不言而喻的,或者至少很容易从文档中获得。
gung-恢复莫妮卡

1
@gung-我的问题与软件无关。可能是我放错了地方。我只想了解的是,根据我的理解,只有在最大方差线中旋转轴时,我们才能获得主成分。然后是未旋转的主要成分,这是我在各个页面上找到的有关PCA的术语。请让我知道我的问题是否仍然不明确。
Srewashi Lahiri

看起来肯定与SAS有关。如果不是,我将编辑您的Q来删除对SAS的引用,并以软件独立的方式重新解释您的问题。您可能也有兴趣阅读此主题
gung-恢复莫妮卡

我之所以提到SAS,是因为我正在该软件中进行分析。即使您不喜欢这个词,也可以只提供我对问题的编辑版本的解释。我也经历了这个话题。如果我错了,请纠正我。当我们计算主成分时,这意味着轴已经旋转。因此,不需要其他的varimax表示法。是这样吗?我对这部分真的很困惑。许多在此先感谢
Srewashi拉希里

2
Srewashi,根据您在评论中的澄清,我已经自由地实质性地重写了您的问题。我认为这是一个好问题,+ 1。请检查我的修改是否反映了您的意图!您可以随时编辑更多内容。抄送@gung。
变形虫说莫妮卡

Answers:


15

这将是一个非技术性的答案。

没错:PCA本质上是坐标轴的旋转,其选择应使每个成功的轴都捕获尽可能多的方差。

在某些学科(例如心理学)中,人们喜欢应用PCA来解释结果轴。也就是说,他们希望能够说主轴#1(它是原始变量的某种线性组合)具有某些特殊含义。为了猜测这个含义,他们将查看线性组合中的权重。但是,这些权重通常很杂乱,无法分辨清楚的含义。

在这种情况下,人们有时会选择修改原始的PCA解决方案。他们采取一定数量的主轴(被认为有些标准“显著”),并另外旋转它们,努力实现一些“结构简单” ---也就是线性组合,这将是更容易解释。有一些特定的算法正在寻找最简单的结构。其中之一称为varimax。在varimax旋转之后,连续的组件不再捕获尽可能多的方差!PCA的此功能通过执行额外的varimax(或任何其他)旋转而被破坏。

因此,在应用varimax旋转之前,您具有“未旋转”的主分量。然后,您将获得“旋转”的主要组件。换句话说,该术语是指PCA结果的后处理,而不是 PCA轮换本身。


由于旋转的是负载而不是主轴,所以所有这些都有些复杂。但是,关于数学上的细节,我会在这里为您(和任何感兴趣的读者)提供我的长答案:PCA后跟旋转(例如varimax)仍然是PCA吗?


我还没有遇到更好,更清晰的解释。我还浏览了您提供的其他链接,但我还没有完全理解它。如果我理解正确,那么未旋转的主成分已经是正交且不相关的。在这里,我有点困惑-由于PC对应于连续的最大方差,那么有必要在找到第一个PC之后,第二个最大方差线(第二个PC)将与第一个最大方差成90度(正交),依此类推?
Srewashi Lahiri

没错:“未旋转”的主分量是不相关的,而“未旋转”的主轴是正交的。是的,有必要使连续的主轴正交并且主分量与先前的主轴不相关(一个人可以用数学方法证明)。顺便说一句,如果您认为此(或任何其他)答案可以为您解决问题,则可以通过单击左侧的绿色对勾来“接受”它。一旦获得15点声望,您就可以对您认为有用的答案进行投票(我认为当前您无法对任何答案进行投票)。
变形虫说莫妮卡(Reonica Monica)

+1。what gets rotated are loadings and not principal axes as such我要补充一点,这是一个技术概念。从理论上讲,这两种旋转是并列的。在PCA中,我们旋转以找到特定的正交基础(特征值的斜线图最陡的正交基础)。在varimax中,我们旋转以找到另一个特定的正交基础(具有最交织的结构)。我们可以做任何一种正交的基础。
ttnphns

如果可能的话,您可以用外行术语解释未旋转的pc是什么意思?
sai_636 '19

@ sai_636有关外行条款,请参阅stats.stackexchange.com/questions/2691
变形虫说恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.