我已经阅读并看到了许多平行坐标图。有人可以回答以下问题:
- 简单来说,什么是平行坐标图(PCP),以便外行可以理解?
- 可能的话凭直觉进行数学解释
- PCP何时有用,何时使用?
- 如果是PCP 不是有用的时,应避免他们?
- PCP的可能优缺点
我已经阅读并看到了许多平行坐标图。有人可以回答以下问题:
Answers:
在我看来,PCP的主要功能是突出个人的同质群体,或者相反地(在双重空间中,类似于PCA)突出不同变量上的特定关联模式。当变量不太多时,它会生成有效的图形化的多变量数据集摘要。变量会自动缩放到固定范围(通常为0-1),这等效于使用标准变量(以防止由于缩放问题而使一个变量对另一个变量产生影响),但是对于超高维数据集(# (> 10),您肯定必须查看其他显示,例如微阵列研究中使用的波动图或热图。
它有助于回答以下问题:
在下面的鸢尾花数据图中,可以清楚地看到,物种(此处以不同的颜色显示)在考虑花瓣的长度和宽度时显示出非常可识别的轮廓,或者鸢尾鸢尾花(蓝色)在花瓣长度方面更为均匀(例如,它们的方差较低)。
您甚至可以将其用作分类或降维技术的后端,例如PCA。最常见的是,在执行PCA时,除了减少特征空间外,您还希望突出显示个人集群(例如,是否有人在某些变量组合上系统地得分较高);通常,通过对因子得分应用某种层次聚类并在阶乘空间上突出显示所得的聚类成员关系,可以降低这种情况(请参阅FactoClass R程序包)。
它也用在集群图中(可视化非分层集群和分层集群分析),该集群图旨在检查集群数量在集群数量增加时如何演变(另请参阅,实践中使用了哪种聚集准则来阻止聚集集群?)。
当链接到通常的散点图(通过构造仅限于2D关系)时,此类显示也很有用,这被称为刷涂,可在GGobi数据可视化系统或Mondrian软件中使用。
关于问题3、4和5,我建议您检查一下这项工作
总结他们的发现,人们可以确定每个节点之间关系的斜率的方向,但是不擅长确定关系的强度或斜率的程度。他们给出了建议的噪音水平,人们仍然可以在其中理解文章中的关系。不幸的是,本文并未像chl演示的那样讨论通过颜色识别子组的问题。
请访问http://www.cs.tau.ac.il/~aiisreal/,并查看新书
平行坐标-本书是关于可视化的,系统地将奇妙的人类模式识别纳入解决问题的过程中... www.springer.com/math/cse/book/978-0-387-21507-5。
在Ch。在图10中,有很多带有多元数据的真实示例,它们显示了如何使用平行坐标(缩写|| -cs)。值得学习一些数学知识以可视化并使用多元/多维关系(表面),而不仅仅是点集。看到并使用多个维度的熟悉对象的类似物(例如Moebius条形,凸集等),这很有趣。
简而言之|| -cs是多维坐标系,其中的轴彼此平行,因此可以看到许多轴。该方法已应用于空中交通管制,计算机视觉,过程控制和决策支持中的冲突解决算法。