Questions tagged «histogram»

直方图是连续变量频率的图形表示。将该变量划分为bin,并为每个bin绘制一个条形,与数据中其频率成比例。

2
在结合了两个分布的模型中测量拟合优度
我有要建模的双峰数据,并且峰之间有足够的重叠,因此无法独立对待它们。数据的直方图可能看起来像这样: 为此,我创建了两个模型:一个模型使用两个Poisson分布,另一个模型使用两个负二项式分布(以解决过度分散问题)。哪种模型可以更准确地确定适合数据的合适方法是什么? 我最初的想法是,我可以使用Kolmogorov-Smirnov检验将每个模型与数据进行比较,然后进行似然比检验,看是否一个模型更合适。这有意义吗?如果是这样,我不确定如何执行似然比测试。卡方是否合适,我有多少自由度? 如果有帮助,这些模型的一些(非常简化的)R代码可能看起来像这样: ## inital data points a <- read.table("data") #create model data model.pois = c(rpois(1000000,200),rpois(500000,250)) model.nb = c(rnbinom(1000000,200,0.5),rnbinom(500000,275,0.5) #Kolmogorov-Smirnov test #use ks.boot, since it's count data that may contain duplicate values kpois = ks.boot(model.pois,a) knb = ks.boot(model.nb,a) #here's where I'd do some sort of likelihood ratio test # …

2
可视化多个“直方图”(条形图)
我很难选择正确的方式来可视化数据。假设我们有一家书店出售书籍,每本书至少都有一个类别。 对于书店,如果我们计算书籍的所有类别,我们将获得一个直方图,该直方图显示属于该书店特定类别的书籍数量。 我想形象化书店的行为,我想看看他们是否喜欢某个类别而不是其他类别。我不想看看他们是否一起都喜欢科幻小说,但我想看看他们是否平等地对待每个类别。 我有约100万家书店。 我想到了4种方法: 采样数据,仅显示500家书店的直方图。使用10x10网格在5个单独的页面中显示它们。4x4网格的示例: 与#1相同。但是这次根据它们的计数desc对x轴值进行排序,因此如果有帮助,就很容易看到。 想象一下将#2中的直方图像一个甲板一样放在一起并以3D形式显示它们。像这样: 代替使用第三轴使用颜色来表示颜色,而是使用热图(2D直方图): 如果通常书店偏爱某些类别而不是其他类别,它将以从左到右的漂亮渐变显示。 您还有其他表示多个直方图的可视化想法/工具吗?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.