Questions tagged «pca»

主成分分析(PCA)是线性降维技术。它将多变量数据集简化为较小的构造变量集,以保留尽可能多的信息(尽可能多的方差)。这些变量称为主成分,是输入变量的线性组合。

3
关于PCA术后斜转
几个统计软件包(例如SAS,SPSS和R)使您可以在PCA之后执行某种因子轮换。 为什么要在PCA之后进行轮换? 考虑到PCA的目的是产生正交尺寸,为什么要在PCA之后进行倾斜旋转?

2
可视化多个“直方图”(条形图)
我很难选择正确的方式来可视化数据。假设我们有一家书店出售书籍,每本书至少都有一个类别。 对于书店,如果我们计算书籍的所有类别,我们将获得一个直方图,该直方图显示属于该书店特定类别的书籍数量。 我想形象化书店的行为,我想看看他们是否喜欢某个类别而不是其他类别。我不想看看他们是否一起都喜欢科幻小说,但我想看看他们是否平等地对待每个类别。 我有约100万家书店。 我想到了4种方法: 采样数据,仅显示500家书店的直方图。使用10x10网格在5个单独的页面中显示它们。4x4网格的示例: 与#1相同。但是这次根据它们的计数desc对x轴值进行排序,因此如果有帮助,就很容易看到。 想象一下将#2中的直方图像一个甲板一样放在一起并以3D形式显示它们。像这样: 代替使用第三轴使用颜色来表示颜色,而是使用热图(2D直方图): 如果通常书店偏爱某些类别而不是其他类别,它将以从左到右的漂亮渐变显示。 您还有其他表示多个直方图的可视化想法/工具吗?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.