可视化多个集合的交集


30

是否有一个可视化模型可以很好地显示许多集合的交集重叠?

我在思考类似维恩图的方法,但是它可能以某种方式更好地适用于更多的集合,例如10个或更多集合。Wikipedia确实显示了一些较高的维恩图,但即使是4组图也需要很多。

我对数据的最终结果的猜测是,许多数据集不会重叠,因此维恩图可能会很好-但我想找到一种能够生成该数据的计算机工具。在我看来,它看起来像Google图表不允许那么多集合。


1
相关,但数量少(供参考):stats.stackexchange.com/questions/4211/…– 2011

Answers:


18

当您有大量集合时,我会尝试一些线性度更高的东西,并直接显示链接(例如网络图)。Flare和Protovis都有实用程序来处理这些可视化。

请参阅此问题以获取类似以下示例

替代文字


(+1)个好答案!-我特别喜欢图形。我想知道在R中是否有办法做到这一点?
suncoolsu 2011年

1
我不知道有什么办法。我的webvis软件包为Protovis提供了包装,但是要制作此图形,需要大量的工作。顺便提一句,本文介绍了相关的“弧形图”:ieg.ifs.tuwien.ac.at/~aigner/teaching/ws06/infovis_ue/papers/…–
Shane

1
@suncoolsu,R包图可能可以完成Shane所指向的“弧形图”。虽然使“绘图网”看起来像上面的视觉效果似乎很困难。cran.r-project.org/web/packages/diagram/vignettes/diagram.pdf
安迪W

和安迪。谢谢您的回答。@Shane,我看过您的webvis软件包。但是我仍然需要进一步探索。我非常喜欢protovis图。他们有一个很棒的网站。
suncoolsu 2011年

1
漂亮的图,但是它不能回答最初的问题,因为您不能表示3个或更多集合的交集。是否有它的变体?
nassimhddd

11

这不会与@Shane的答案竞争,因为圆形显示确实非常适合显示与高维数据集的复杂关系。

venn()ķ=4

ķ=4

供进一步参考,您可能会对

Kestler et al。,Generalized Venn diagrams:一种可视化复杂遗传集关系的新方法,Bioinformatics,21(8),1592-1595(2004)。

但是,维恩图有其局限性。在这方面,我喜欢罗伯特·科萨拉(Robert Kosara)在《目击:有尊严的挑战》或《平行布景》中所采用的方法(但也可以在安德鲁·盖尔曼(Andrew Gelman)网络博客上参阅此讨论)。


看起来不错。如果它接受非数值的话,我会喜欢的。似乎必须先将其数据转换为数字列表。
eastafri 2011年

出于实际目的,包括一些
屏幕抓屏

7

我们为集合相交开发了一种基于矩阵的方法,称为UpSet,您可以在http://vcg.github.io/upset/中进行检查。这是一个例子:

UpSet屏幕截图

左侧的矩阵标识一行所代表的交集,例如,此处的最后一行是“动作,冒险和儿童”电影类型的交集。右边的条显示了相交的大小,在此示例中为4。

您还可以绘制相交或其他选择等的属性。请访问网站以获取详细信息。

现在还有一个R的静态版本,您可以在上面提到的网站上找到,或者通过以下网站找到:https : //github.com/hms-dbmi/UpSetR/

可在http://www.cvast.tuwien.ac.at/SetViz上获取有关集合可视化的最新报告-尽管其中大多数都是学术性的,并且没有附带可用的代码。


1
对于我来说,您发布的图像只是过度绘图的一个示例,在一个绘图中堆积了太多信息……
蒂姆

1
@蒂姆 虽然我明白您的意思,但实际上并没有画图,因为所有视觉元素都清晰可见且分开。您可能会认为该图太复杂而无法轻易辨别,但这也可能与您未受过使用该图的训练有关—并非所有可视化都可以或不应该针对未经培训的用户,因为简化通常会导致范围有限(例如
维恩

@ ThomasP85的大量研究表明,人们对地块的视觉解释确实很糟糕(甚至是“专家”),甚至包括饼图之类的基本东西。在大多数情况下,复杂的可视化会导致误解和误解。
蒂姆

@Tim我同意简单总是更好,但是复杂的问题有时会有复杂的答案。首先提出这个问题的原因是,到目前为止,那里还没有一种引人注目的简单可视化技术来处理大量设置的交集。可接受的答案仅涉及2度相交,随着集数的增加,该2度相交在相交总数中所占的比例越来越小。
ThomasP85

...以及您的饼图示例与以下事实有关:人类(无论是专家还是非专家)在比较角度时都感到
恐惧
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.