我有250个单位的样本。分布是不对称的。我想检验一个假设,即人口中位数不同于3.5,因此我认为单样本检验是合适的。我知道Wilcoxon等级检验不适合,因为分布不对称。是否适合使用符号测试?如果不是,任何人都可以推荐其他测试吗?
我有250个单位的样本。分布是不对称的。我想检验一个假设,即人口中位数不同于3.5,因此我认为单样本检验是合适的。我知道Wilcoxon等级检验不适合,因为分布不对称。是否适合使用符号测试?如果不是,任何人都可以推荐其他测试吗?
Answers:
超过的数据计数具有二项式分布,概率为。使用它对替代进行的二项式检验。
本文的其余部分将说明基础模型,并说明如何执行计算。它提供R
了执行代码以执行它们。我对“统计检验中p值和t值的含义是什么?”的回答提供了对基础假设检验理论的扩展解释。。
假设值合理地不同(在处有很少的联系),那么在您的零假设下,任何随机采样的值都有超过机会(因为的特征是总体的中间值) 。假设所有值都是随机且独立采样的,则超过将具有二项式分布。让我们将此数字称为“计数”。
另一方面,如果总体中位数不同于,则随机采样值超过的机会将不同于。这是另一种假设。
区分空值情况与其替代方案的最佳方法是查看的值,该值最有可能在空值下,而在替代方案下则不太可能。这些值接近的,等于。因此,测试的关键区域由相对较远的值组成::接近或接近。但是,它们必须距离多远才能构成表明不是人口中位数的重要证据?
取决于您的重要性标准:这称为测试大小,通常称为。在零假设下,应该有接近-但不超过-一机会将在关键区域。
通常,当我们对哪种替代方法没有先入之见(中值大于或小于时,我们会尝试构建关键区域,以便有一半的机会,即低,并且另一半,则高。因为我们知道零假设下的分布,所以该信息足以确定关键区域。
从技术上讲,有两种常见的计算方法:计算二项式概率或使用正态分布对其进行近似。
使用百分比(分位数)功能。R
例如,在中,这qbinom
会被调用,并且会像
alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)
输出为 是
109141
这意味着关键区域包括所有的低值 在(包括)之间 和 以及所有的高价值 在(包括)之间 和 。作为检查,我们可以要求R
计算k
null为true时位于该区域的机会:
pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))
输出是 ,非常接近-但不大于-本身。由于关键区域必须以整数结尾,因此通常不可能使此实际测试大小与标称测试大小完全相等,但是在这种情况下,这两个值确实非常接近。
二项式的均值 分布是 它的方差是 ,使其标准偏差等于 。我们将用正态分布替换二项分布。标准正态分布具有 其概率小于 ,由R
命令计算
qnorm(alpha/2)
因为正态分布是对称的,所以它也具有 其概率大于 。因此,关键区域包含以下值: 不仅仅是 偏离标准偏差 。计算这些阈值:它们等于。可以一口气进行计算
250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)
以来 必须是一个整数,我们看到它会落入关键区域 或更少或 或更高。该答案与使用精确二项式计算获得的答案相同。这种情况通常发生在 更近 比它要 要么 ,样本大小为中到大(数十个或更多),并且 不是很小(百分之几)。
该测试因为不对总体进行任何假设(除了它没有太多的概率集中在其中位数上),所以它不像对总体进行特定假设的其他测试那么强大。但是,如果测试拒绝了空值,则无需担心功率不足。否则,您必须在您愿意承担的假设与您可以得出的有关人口的结论之间进行一些微妙的权衡。