我找到了一篇介绍箱型图的多维(此处为双变量)版本的文章-风箱图。那是什么风筝呢?我可以看到一系列基于顶点的嵌套多边形,其中一个多边形被声明为风标图。嵌套多边形构建的想法是什么?风标图是哪个多边形(中心或保持平均点数)?Bagplot的边缘是否具有一些有用的属性(例如专门划分点集)?
我找到了一篇介绍箱型图的多维(此处为双变量)版本的文章-风箱图。那是什么风筝呢?我可以看到一系列基于顶点的嵌套多边形,其中一个多边形被声明为风标图。嵌套多边形构建的想法是什么?风标图是哪个多边形(中心或保持平均点数)?Bagplot的边缘是否具有一些有用的属性(例如专门划分点集)?
Answers:
这是一个带有注释的示例:
这是The Bagplot: A Bivariate Boxplot
Peter J.Rousseeuw,Ida Ruts和John W.Tukey 的文章,来自The American Statistician
:http : //venus.unive.it/romanaz/ada2/bagplot.pdf
从该文章的摘要中:
“深度中值”是最深的位置,并且被包含“ n / 2”个深度最大的观测值的“包”包围。将袋子放大3倍,便会产生“围栏”(未绘制)。袋子和围栏之间的观察结果以浅灰色圆圈标记,而围栏外部的观察结果则标记为异常值。风标图可视化数据的位置,散布,相关性,偏度和尾部。
这是关键部分的图示:
其他讨论可以在下面找到:
从软件包的帮助文档aplpack
(针对R
用户):
bagplot是众所周知的boxplot的双变量概括。它由Rousseeuw,Ruts和Tukey提出。在双变量情况下,箱线图的框变为凸包,即箱线图的袋。袋子里有百分之五十的东西。栅栏将栅栏中的点与外部点分开。通过增加袋子来计算。循环定义为包含围栏内所有点的凸多边形。如果所有点都在一条直线上,则将获得经典箱线图。bagplot()绘制与Rousseeuw等人中所述非常相似的袋状图。备注:二维中值是近似值。使用小型数据集存在已知的困难(但我认为做出(图形)摘要(例如10分)是不明智的。)
如果人们想绘制多个(重叠的)袋状图,则这些图是半透明的很方便。因此,透明度标记已添加到bagplot命令中。如果透明度== TRUE,则将alpha图层设置为“ 99”(十六进制)。这会导致袋状图显示为半透明,但仅当输出设备为PDF并使用以下格式打开时才显示:pdf(file =“ filename.pdf”,version =“ 1.4”)。因此,默认值为透明度==假。Wouter Meuleman提出了此功能以及指定不同颜色的参数。
还有一个例子:
library(aplpack)
attach(mtcars)
bagplot(wt, mpg, xlab="Car Weight",
ylab="Miles Per Gallon",
main="Bagplot Example",
transparency = TRUE,
show.whiskers = FALSE,
# note that data a 'fence' separates inliers from outliers,
# and a 'loop' indicates the points outside the bag but
# inside the fence. In the 'bag' are 50 percent of all
# points
show.loophull = TRUE, # draw 'loop'?
show.baghull = TRUE) # draw 'bag'?
相关问题: