假设我有两个分布要详细比较,即以使形状,比例和偏移容易看到的方式比较。做到这一点的一种好方法是绘制每个分布的直方图,将它们放在相同的X比例尺上,然后在另一个下方堆叠。
执行此操作时,应如何进行装箱?即使一个分布比另一个分布更分散,两个直方图是否也应使用相同的bin边界,如下面的图像1所示?是否应在缩放之前针对每个直方图分别进行合并,如下面的图像2所示?在这方面是否有很好的经验法则?
5
QQ绘图是对经验分布进行精确比较的更好的工具。使用它们可以完全避免装箱问题。
—
ub
@whuber:同意,如果你只是想的两个分布是否有不同的敏感可视化,但直方图的方法是恕我直言更好,如果你想详细了解如何他们是不同的。
—
dsimcha 2011年
@dsimcha我的经历正好相反。QQ图清楚地(以定量方式)显示了比例,位置和形状的差异,尤其是在尾巴的厚度上。(例如,尝试直接从直方图中比较两个SD:当它们的值接近时,这是不可能的。在QQ绘图上,您只需要比较斜率,这是快速且相对准确的。)QQ绘图在条件上不如直方图挑选模式,但直方图无法做到这一点,除非收集到可观的数据量并做出了不错的垃圾箱选择。
—
ub
我同意QQ绘图是最好的解决方案,尽管它们不能避免垃圾箱问题,它们只是迫使您将垃圾箱放置在特定的位置(分位数:-)。另一方面,这确实意味着垃圾箱不会,的确不应由两个发行版共享。
—
共轭木
@dsimcha,我认为诸如年龄/性别图之类的东西可能是有用的图片。无论如何,为什么要为此使用直方图?只需直接绘制分布函数即可。但是,如果您在玩经验游戏,那么QQ情节建议是最佳选择。
—
Dmitrij Celov'3