小提琴情节解读


9

我正在使用小提琴图来比较不同组的分布,但是我发现的大多数在线资源都与如何制作图和结果的非常基本的解释有关(中位数变化,数据是否聚类)。

我正在寻找可以参考的详细示例,以正确解释小提琴图。

Answers:


9

小提琴图只是直方图(或更常见的是像内核密度这样的平滑变体),在其侧面翻转并镜像。任何教您如何解释直方图的教科书都应为您提供直觉。 根据Nick Cox的建议进行编辑: Freedman,Pisani,Purves,Statistics涵盖直方图。

至于以一种更正式的方式来解释它们,绘制分布图的全部目的是要看到统计测试可能被愚弄的东西。

我喜欢用小提琴图做的一件事是为中位数,均值等添加线。有时我会叠加一个箱线图,这样我就可以以摘要统计的方式看到更多内容。

至少,您应该能够在最初的几分钟内选择出任何明显的偏差(均值,离散度,偏度,峰度)以及双峰和离群值。


2
+1,类似的图是人口金字塔,反射分布只是一个不同的类别(并且它使用更典型的直方图类型估计器而不是kde)。
安迪W

1
Tukey(探索性数据分析)和Cleveland (图形数据元素)都没有对直方图说太多:两者都对其他表示形式更感兴趣,也给他们留下了深刻的印象。这些是这里提到的书吗?Freedman,Pisani,Purves,Statistics是一本涵盖了直方图的基本书籍。
Nick Cox 2013年

1
实际上,克利夫兰确实对直方图说了些什么。他说它们是差的图形,不会在他的书中使用。:-)。F,P和P是一本很棒的书。
彼得·弗洛姆

1
我是FPP的老师 他们不会明确地使用OLS来预测矩形的面积,因为他们没有明确地进行多元回归。他们确实有一些这种精神的例子。例如,如果伽利略试图通过线性回归来预测物体从高度h坠落所需的时间t,该怎么办?您得到了一个很好的最小二乘拟合,但事实当然是 -故事的寓意是始终查看残差。t=ch
Michael Lugo

1
@TrevorAlexander这是一个很好的问题。我不知道有任何文献反映出镜像后的解释会更好,但至少在我看来,它们确实比垂直方向的直方图更好看。
阿里·弗里德曼
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.