如何测试人口中位数?


9

我有250个单位的样本。分布是不对称的。我想检验一个假设,即人口中位数不同于3.5,因此我认为单样本检验是合适的。我知道Wilcoxon等级检验不适合,因为分布不对称。是否适合使用符号测试?如果不是,任何人都可以推荐其他测试吗?


3
您在第一行失去了我,原因有几个。(1)样本不能具有高斯分布(但可以近似具有一个高斯分布)。(2)所有高斯分布(及其近似值)的一个特征是对称性。你自相矛盾。通过用自己的术语(而不是统计术语)描述数据,您将更好地传达自己的数据。您能否以一种简单的方式来解释您真正想要用数据完成什么?“基于中位数的样本检验”旨在为您提供什么样的信息?
whuber

1
样本的中位数是多少。无需测试。也许您想测试人口中位数(从中获取样本)是否等于?如果是这样,那么重要的是要知道的值是如何产生的。也许是其他一些数据集的摘要吗?还是预定的数字,例如质量标准?3.53.5
ub

1
这是一个预定的数字
LeonRupnik

2
分布是不对称的,因此如果人口中位数与3.5不一致,我想检验假设。”-为什么样本中的不对称会影响有趣的假设? “ 是否适合使用符号测试? ”-当然,但是(至少以原始形式)它依赖于连续性-如果变量是离散的,则需要对其进行调整(您不必说数据由什么组成)的)。
Glen_b-恢复莫妮卡2015年

数据是连续的
LeonRupnik 2015年

Answers:


8

概要

超过的数据计数具有二项式分布,概率为。使用它对替代进行的二项式检验。3.5pp=1/2p1/2

本文的其余部分将说明基础模型,并说明如何执行计算。它提供R了执行代码以执行它们。我对“统计检验中p值和t值的含义是什么?”的回答提供了对基础假设检验理论的扩展解释。。

统计模型

假设值合理地不同(在处有很少的联系),那么在您的零假设下,任何随机采样的值都有超过机会(因为的特征是总体的中间值) 。假设所有值都是随机且独立采样的,则超过将具有二项式分布。让我们将此数字称为“计数”。3.51/2=50%3.53.52503.5(250,1/2)k

另一方面,如果总体中位数不同于,则随机采样值超过的机会将不同于。这是另一种假设。3.53.51/2

寻找合适的测试

区分空值情况与其替代方案的最佳方法是查看的值,该值最有可能在空值下,而在替代方案下则不太可能。这些值接近的,等于。因此,测试的关键区域由相对较远的值组成::接近或接近。但是,它们必须距离多远才能构成表明不是人口中位数的重要证据?k1/225012512502501253.5

取决于您的重要性标准:这称为测试大小,通常称为。在零假设下,应该有接近-但不超过-一机会将在关键区域。ααk

通常,当我们对哪种替代方法没有先入之见(中值大于或小于时,我们会尝试构建关键区域,以便有一半的机会,即低,并且另一半,则高。因为我们知道零假设下的分布,所以该信息足以确定关键区域。3.5α/2kα/2kk

从技术上讲,有两种常见的计算方法:计算二项式概率或使用正态分布对其进行近似。

用二项式概率进行计算

使用百分比(分位数)功能。R例如,在中,这qbinom会被调用,并且会像

alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)

输出为 α=0.05

109141

这意味着关键区域包括所有的低值 k 在(包括)之间 0109以及所有的高价值 k 在(包括)之间 141250。作为检查,我们可以要求R计算knull为true时位于该区域的机会:

pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))

输出是 0.0497,非常接近-但不大于-α本身。由于关键区域必须以整数结尾,因此通常不可能使此实际测试大小与标称测试大小完全相等α,但是在这种情况下,这两个值确实非常接近。

用正态近似计算

二项式的均值(250,1/2) 分布是 250×1/2=125 它的方差是 250×1/2×(11/2)=250/4,使其标准偏差等于 250/47.9。我们将用正态分布替换二项分布。标准正态分布具有α/2=0.05/2 其概率小于 1.95996,由R命令计算

qnorm(alpha/2)

因为正态分布是对称的,所以它也具有 0.05/2 其概率大于 +1.95996。因此,关键区域包含以下值:k 不仅仅是 1.95996 偏离标准偏差 125。计算这些阈值:它们等于125±7.9×1.96109.5,140.5。可以一口气进行计算

250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)

以来 k 必须是一个整数,我们看到它会落入关键区域 109 或更少或 141或更高。该答案与使用精确二项式计算获得的答案相同。这种情况通常发生在p 更近 1/2 比它要 0 要么 1,样本大小为中到大(数十个或更多),并且 α 不是很小(百分之几)。


该测试因为不对总体进行任何假设(除了它没有太多的概率集中在其中位数上),所以它不像对总体进行特定假设的其他测试那么强大。但是,如果测试拒绝了空值,则无需担心功率不足。否则,您必须在您愿意承担的假设与您可以得出的有关人口的结论之间进行一些微妙的权衡。


2
由于这实际上是您更为抽象的“ p值 ”答案含义的有效示例,不仅在支持相同的哲学上,而且在答案的结构方式上,我认为您应该将其链接起来(“如何在实践中应用这一点,可以在我对……的回答中找到答案。
银鱼

2
@银谢谢你;确实让我无所适从。我以为我可以先等一下。除其他事项外,如果一些有进取心的社区成员挖掘出重复的话题,我也不会感到惊讶,我想对此进行更仔细的研究。毕竟,这是基本材料-有关二项式检验的许多问题都已问到。唯一需要新颖的说法是它到达这里是为了对中位数进行检验-因此一开始它显然不是二项式检验-而且我唯一的回答必须是值得阅读在于努力解释每一步。
whuber
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.