2
计算第95个百分位数:比较正态分布,R Quantile和Excel方法
我试图在以下数据集中计算第95个百分位数。我遇到了一些这样做的在线参考。 方法1:基于样本数据 在第一个告诉我获得TOP 95 Percent的数据集,然后选择MIN或AVG生成的一组。对以下数据集执行此操作即可得到: AVG: 29162 MIN: 0 方法2:假设正态分布 所述第二个说,第95百分位是平均约两个标准差以上(我明白)和I进行的: AVG(Column) + STDEV(Column)*1.65: 67128.542697973 方法3:R Quantile 我曾经R获得第95个百分位: > quantile(data$V1, 0.95) 79515.2 方法4:Excel的方法 最后,我遇到了这个,它解释了Excel是如何做到的。该方法的摘要如下: 给定一组N有序值{v[1], v[2], ...}和要求计算pth百分位数,请执行以下操作: 计算 l = p(N-1) + 1 拆分l成整数和小数成分即l = k + d 将所需值计算为 V = v[k] + d(v[k+1] - v[k]) 这种方法给我 79515.2 尽管我相信R的值是正确的值,但没有一个值匹配(我也从ecdf图中观察到了它)。我的目标是从给定的数据集中手动计算第95个百分位数(仅使用AVG和STDEV函数),并且不确定是否会发生什么。有人可以告诉我我要去哪里错吗? 93150 …