Answers:
从理论上讲()表示该点是累积分布的分数。实际上,存在各种定义,特别是在统计计算中。例如,在R中有九种不同的定义,前三种用于离散解释,其余三种用于各种连续插值。
举个例子:如果您的样本是{400,1,1000,40},而您正在寻找0.6分位数(第60个百分位数),则不同的计算方法将得出
> for (t in 1:9) { x[t] <- quantile(c(400, 1, 1000, 40), probs=0.6, type = t ) }
> x
60%
400 400 40 184 364 400 328 376 373
我个人认为正确的数字是400是正确的,因为 这是因为将样本视为总体,如果得出经验CDF,将需要一系列步骤。对于插值,有相反的论据,因此经验CDF是连续的,因为它可能是对总体的更好或更有用的近似,并且插值方法将影响结果。