是否有一个可视化模型可以很好地显示许多集合的交集重叠?
我在思考类似维恩图的方法,但是它可能以某种方式更好地适用于更多的集合,例如10个或更多集合。Wikipedia确实显示了一些较高的维恩图,但即使是4组图也需要很多。
我对数据的最终结果的猜测是,许多数据集不会重叠,因此维恩图可能会很好-但我想找到一种能够生成该数据的计算机工具。在我看来,它看起来像Google图表不允许那么多集合。
是否有一个可视化模型可以很好地显示许多集合的交集重叠?
我在思考类似维恩图的方法,但是它可能以某种方式更好地适用于更多的集合,例如10个或更多集合。Wikipedia确实显示了一些较高的维恩图,但即使是4组图也需要很多。
我对数据的最终结果的猜测是,许多数据集不会重叠,因此维恩图可能会很好-但我想找到一种能够生成该数据的计算机工具。在我看来,它看起来像Google图表不允许那么多集合。
Answers:
这不会与@Shane的答案竞争,因为圆形显示确实非常适合显示与高维数据集的复杂关系。
供进一步参考,您可能会对
Kestler et al。,Generalized Venn diagrams:一种可视化复杂遗传集关系的新方法,Bioinformatics,21(8),1592-1595(2004)。
但是,维恩图有其局限性。在这方面,我喜欢罗伯特·科萨拉(Robert Kosara)在《目击:有尊严的挑战》或《平行布景》中所采用的方法(但也可以在安德鲁·盖尔曼(Andrew Gelman)网络博客上参阅此讨论)。
我们为集合相交开发了一种基于矩阵的方法,称为UpSet,您可以在http://vcg.github.io/upset/中进行检查。这是一个例子:
左侧的矩阵标识一行所代表的交集,例如,此处的最后一行是“动作,冒险和儿童”电影类型的交集。右边的条显示了相交的大小,在此示例中为4。
您还可以绘制相交或其他选择等的属性。请访问网站以获取详细信息。
现在还有一个R的静态版本,您可以在上面提到的网站上找到,或者通过以下网站找到:https : //github.com/hms-dbmi/UpSetR/
可在http://www.cvast.tuwien.ac.at/SetViz上获取有关集合可视化的最新报告-尽管其中大多数都是学术性的,并且没有附带可用的代码。