当零假设为


10

我想对来自二项式数据的单个样本进行功效分析,H0:p=0,而H1:p=0.001,其中p是总体中成功的比例。如果0<p<1,我可以使用任一的正态近似二项式,或χ2 -test,但与p=0,这些都失败。我很想知道是否可以进行这种分析。我非常感谢您的任何建议,评论或参考。非常感谢!


那么,为什么不使用精确的Clopper-Pearson检验呢?
斯特凡·洛朗

2
我希望你有一个真正的大样本!这将很难测试。
彼得·富勒姆

Answers:


13

您有一个单边的精确替代假设,其中p 1 = 0.001p 0 = 0p1>p0p1=0.001p0=0

  • ccnα=0.05c=1n1α>0
  • 第二步是找出在替代假设下在大小为的样本中至少获得成功的概率-这就是您的能力。在这里,您需要一个固定的,以便完全指定二项式分布。cnnB(n,p1)

R的第二步,:n=500

> n  <- 500                 # sample size
> p1 <- 0.001               # success probability under alternative hypothesis
> cc <- 1                   # threshold
> sum(dbinom(cc:n, n, p1))  # power: probability for cc or more successes given p1
[1] 0.3936211

要了解功效如何随样本大小变化,可以绘制一个功效函数: 在此处输入图片说明

nn   <- 10:2000                 # sample sizes
pow  <- 1-pbinom(cc-1, nn, p1)  # corresponding power
tStr <- expression(paste("Power for ", X>0, " given ", p[1]==0.001))
plot(nn, pow, type="l", xaxs="i", xlab="sample size", ylab="power",
     lwd=2, col="blue", main=tStr, cex.lab=1.4, cex.main=1.4)

如果您想知道至少要达到预先指定的功效需要多少样本量,可以使用上面计算的功效值。假设您需要至少。0.5

> powMin <- 0.5
> idx    <- which.min(abs(pow-powMin))  # index for value closest to 0.5
> nn[idx]     # sample size for that index
[1] 693

> pow[idx]    # power for that sample size
[1] 0.5000998

因此,您需要至少的样本大小才能达到功效。6930.5


根据pwr.p.test,对于0.5的功效,您至少需要677个观测值。但是功率= 0.5非常低!
杰西卡·2012年

@caracal您是否使用正态近似来获得功率曲线?精确的二项式幂函数不会那么平滑。它实际上是锯齿状的,您可以看到样本大小轴是否被放大。我在2002年与克里斯汀·刘合着的《美国统计学家》的论文中对此进行了讨论。同样,二项式在非常低的p处有很大的偏斜,以至于n必须大才能使正常逼近正常工作。
Michael R. Chernick

2
@MichaelChernick不,这是来自二项式分布,不是来自正态近似。当然,您是对的,通常来说,二项式检验的功效是一种非单调的锯齿函数。但是请注意,这里有一个特殊情况,。这意味着替代假设的接受区域始终从1开始,与无关。在恒定阈值,恒定,功率是的严格增加的函数。p0=0nc=1p1=0.001n
caracal 2012年

@Jessica请注意,pwr.p.test()使用正态近似,而不是精确的二项式分布。只需键入pwr.p.test即可查看源代码。您会找到调用以pnorm()表明已使用近似值。
caracal 2012年

1
@caracal因此,我可以这样看:在原假设下,成功的概率为0,因此,如果您看到成功,则可以拒绝原假设。这就是为什么将阈值设为1的原因,因为如果二项式总和达到1,则您可以拒绝类型2错误0!现在,在备选方案中,第n次尝试的第一个成功的概率为(1-p) p。当n变为无穷大时,该概率变为0。因此,当S = 1时,任何p> 0的幂都为1 时,停靠的连续规则将停止。n1n
Michael R. Chernick

3

您可以使用pwrR中的软件包轻松回答这个问题。

您将需要定义重要性级别,功效和效果大小。通常,将显着性级别设置为0.05,将功效设置为0.8。更高的功率将需要更多的观察。较低的显着性水平将降低功效。

此包装中使用的比例的效果大小为Cohen's h。小h的截止值通常取为0.20。实际截止值因应用程序而异,在您的情况下可能会更小。h越小,意味着需要进行更多的观察。您说您的选择是。那很小p=0.001

> ES.h(.001, 0)
[1] 0.0632561

但是我们仍然可以继续。

 > pwr.p.test(sig.level=0.05, power=.8, h = ES.h(.001, 0), alt="greater", n = NULL)

 proportion power calculation for binomial distribution (arcsine transformation) 

          h = 0.0632561
          n = 1545.124
  sig.level = 0.05
      power = 0.8
alternative = greater

使用这些值,您至少需要1546个观测值。


1

在您的特定情况下,有一个简单的精确解决方案:

在特定的零假设您永远都不会观察到成功。因此,一旦观察到成功,就可以确定。H0:p=0p0

在备选方案观察到至少1次成功所需的试验次数遵循几何分布。因此,为了获得最小样本数量以实现的幂,您需要找到最小的k,使得H1:p=0.0011β

1β1(1p)(k1)

因此,如果才能获得功率,则至少需要1610个样本。p=0.00180


在阅读对解决方案1的评论时,我意识到,这基本上与您坚持回答一个问题时所获得的解决方案相同。然而,无需凭直觉到达那里就可以阐明一些基本的概率论结果,这一点永远不会有害。
浮动
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.