一种潜在的想法是使用Sankey图来记录类别之间选择的流程。有两个例子可以描述我在说什么:
对您在评论中表达的一些担忧进行了更新。在我看来,“并行设置”程序可以立即完成您想要的操作。下面是该程序的输出,其中我创建了4个带有4个类别的随机变量。无论您初始化到显示顶部的哪个组,都将被依次划分为后续类别。创建所需的拆分。
在此图中也看不出来,该程序包具有一些交互式功能,可以简化探索性数据的分析,例如,当您将鼠标悬停在某个类别上时,将突出显示其所有后代。
我已经将相同的数据集上载到Fineo,您可以在此处进行探索。除了最初的4个类别变量(命名dec1
为dec4
)之外,我还包括了可用于检查拆分类别的级联类别。带exp
后缀的变量的命名约定是它是dec
通过串联先前选择的类别而扩展的变量。因此,dec3_exp12
将被标记为121
如果dec1 = 1 and dec2 = 2 and dec3 = 1
。您可以在Fineo中创建与ParSets中可用的相同的拆分类型结构,但是它无法使用43 或更多示例中的节点。
在与Fineo一起玩了更多之后,它是一个简洁的应用程序,但是它确实受到限制。并行集具有更多功能,因此建议您在Fineo应用程序之前检查一下。
我认为ParSets程序比将类别依次分成子集进行检查要好得多。举例来说,使用与上述相同的随机数据,这是一个点图,它根据为decision 2
选择的类别绘制了所选条件下的比例类别decision 1
。
您可以对从decision 2
到进行相同的细分decision 3
,但要为初始值做一个小的倍数图decision 1
。
您可以无限地继续此操作(请参见下文)。也许这很有启发性,但是我怀疑当您接触更多的小组时,这将是相当令人生畏的。以下是根据要求显示的4个连续类别的选择。
如前所述,当您将图形分为多个类别时,数量很少是有问题的。解决该问题的一种方法是将诸如尺寸之类的美感映射到比例所基于的基线。这从较小的角度缩小了观察范围。您也可以使用透明度(但在此示例中,我已经将这些点设为透明以区分过度绘制的点)。
我想象有些人正在设想一种像节点结构的圣诞树,而不是点状图,但是我不知道如何制作这样的图形。我怀疑这可能会遇到同样的压倒性问题。这些小的倍数还不错,但是IMO平行集更直观了,我怀疑一些非显而易见的模式在该可视化中会更明显。也许比我更有想象力的人可以提供一些有趣的数据,而不仅仅是4个随机类别。