用比例和二项式分布确定样本大小


10

我正在尝试使用Sokal和Rohlf(3e)写的《生物统计学》一书来学习一些统计数据。这是第5章的练习,其中涵盖了概率,二项式分布和泊松分布。 在此处输入图片说明

我意识到有一个公式可以回答这个问题: 但是,该公式不在本文中。我想知道如何仅知道概率,所需的置信度和二项式分布来计算样本量。有没有涉及这一主题的资源?我已经尝试过Google,但是到目前为止,我所看到的都需要我无法访问的信息。

n=4(pq)2

1
您是否想在寻找答案的过程中得到指导,还是只希望得到答案以及为什么要给出答案的解释?
jbowman

2
旅途听起来不错。这不是针对班级的,答案在问题的末尾给出。我不在乎只知道答案-我已经知道了!很多年前,我参加了统计课程,但是那时我还不够欣赏。我正在尝试对此进行补救,并且实际上开始了解其基本模式。非常感谢您的帮助。这个特殊的问题似乎与本节中的其他问题不相适应,并且从文本中关于二项式分布的信息或给出的示例中,没有清楚地证明适当的方法(对我而言)。
2013年

1
我将非常有兴趣阅读有关该问题的详细答案(如有必要,请提供进一步阅读的指导)。
2013年

2
让我们考虑一个具体的简单示例;您从有病原体的人那里得到了5张幻灯片。您未能正确地识别此人为病原体的可能性是多少?一个隐藏的假设是,载玻片上是否存在病原菌与取自同一样本的其他载玻片上是否存在病原菌无关。
jbowman 2013年

1
那就是连续获得5个假阴性的可能性:
困惑的2013年

Answers:


8

这就是在5张幻灯片中获得假阴性的可能性:

(0.80)^ 5 = 0.32768

嗯,因此,为了将误报率降低到1%以下,您可以执行以下操作:

> x <- matrix(c(0), nrow=25)
> for(i in 1:25) x[i] = (0.8)^i
> x
             [,1]
 [1,] 0.800000000
 [2,] 0.640000000
 [3,] 0.512000000
 [4,] 0.409600000
 [5,] 0.327680000
 [6,] 0.262144000
 [7,] 0.209715200
 [8,] 0.167772160
 [9,] 0.134217728
 [10,] 0.107374182
 [11,] 0.085899346
 [12,] 0.068719477
 [13,] 0.054975581
 [14,] 0.043980465
 [15,] 0.035184372
 [16,] 0.028147498
 [17,] 0.022517998
 [18,] 0.018014399
 [19,] 0.014411519
 [20,] 0.011529215
 [21,] 0.009223372
 [22,] 0.007378698
 [23,] 0.005902958
 [24,] 0.004722366
 [25,] 0.003777893

并发现在i = 21时,假阳性率小于1%。

大!谢谢。我不敢相信我没有看到。由于某种原因,我尝试了各种条件概率。保持简单,愚蠢...


1
是的,有时候最简单的问题最困难!
jbowman
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.