女士品尝茶的力量


9

在著名的费舍尔实验中,可观察到的是具有杯子和两种的校正猜想杯子的数量。通常,给定测试的大小,计算临界区域以拒绝零假设(女士在随机猜测)是很有趣的。使用超几何分布很容易做到这一点。以相同的方式,我可以在给定关键区域的情况下计算测试的大小。kABα

一个不同的问题是:给定替代假设,如何计算检验的功效?例如,假设女士能够在单个杯子上概率正确地猜测()。假设杯子的总数等于并且一种杯子的总数等于,那么测试的功效是什么?(不幸的是)那位女士认识。p=90%P(guessA|trueA)=P(guess B|true B)=0.9N=8n=N/2=4n

换句话说:如果女士知道存在一种杯子,则(替代假设下正确杯子的数量)的分布是什么?k=n


考虑您的帖子...如果费舍尔决定仅在女士的所有猜测都正确的情况下才决定拒绝空值(我认为是这样),并且只有一种可能的方法可以使所有杯子正确,不应该发生这种情况的概率为是实际吗?0.94=0.6561
Antoni Parellada

当她猜一般的杯子时,您不会拒绝。但是的确,在,这是关键区域。您没有考虑到女士知道每种类型有4杯。顺便说一句,我对一般解决方案N 8N=8N8
Ruggero Turra

1
这是一个有趣但棘手的问题。确定导致拒绝Ho的表很容易,但是必须考虑在Ha下看到这些表的可能性。以下文章以给定的灵敏度和特异性为经过稍微修改的表格计算功效:Falissard等人的“将品酒和定性方法联系起来的精神病学研究中的淑女品尝茶程序的一般化”。我不确定计算是否正确。如果您确实有一个二项式问题,则可以使用Exact R软件包,但这是一个不同的问题
Peter Calhoun16年

Answers:


3

在替代方案中,女士不是随机猜测,而是“不是随机猜测”涵盖了无限的不同情况。她可能总是猜测得很完美,或者可能只比随机猜测要好得多……而且在一般情况下,甚至没有一个单变量的“尺度”非随机性可以工作(因此我们甚至没有能力)除非我们限制她可能给出的非随机响应的类型)。

因此,为了计算动力,我们必须非常具体的关于如何它的非随机的(和公正如何非随机它是在特定的方式)。

例如,我们可以假设她对每个杯子的口味都像牛奶一样被添加了一个感觉-“牛奶优先”指数是上具有第一次添加牛奶时的平均值(不同)(例如,我们可以假设它是正常的或标志性的),平均值为,方差(被称为“精度”),最后添加牛奶时的平均值为而最先添加牛奶时的平均值为(实际上,可以设置一个更简单但限制性更强的假设,例如μ 0 σ 2 = 1 / ω 2 ω 2 μ 1 σ 2 μ 1 = - μ 0 = 1(,)μ0σ2=1/ω2ω2μ1σ2μ1=μ0=1因此现在所有事物都是一个变量(精度)的函数。因此,对于这些参数的任何给定值,我们可以计算出她使所有8个杯子正确的概率(她经历的四个最小的“牛奶优先”值与四个牛奶秒杯子相关联);如果精确的计算对我们来说太难了,我们可以将其模拟为任何所需的精度。[在假定非随机性只是一个变量的函数的情况下,我们将具有幂曲线-每个参数值的幂值。]

这是她如何执行“胜于随机”的一种特定类型的模型,通过该模型我们可以指定参数并获得功效值。

我们当然可以设想除此以外的许多其他形式的非随机性。


3

在替代假设下,正确猜数的分布遵循非中心超几何分布,该分布根据优势比进行参数化,也就是说,当女士在事实上,实际上是先添加茶,而不是先添加牛奶(或相反)。如果比值比为1,则得到中心超几何分布。

让我们看看这是否有效。我将使用R来进行说明,并使用该MCMCpack软件包,该软件包具有dnoncenhypergeom()计算(非中心)超几何分布的密度的功能。它有参数x的正确数量的猜测(请注意:这是猜测的两个条件之一的,正确的数量,例如,当第一次被真正加入茶),参数n1n2m1三四个利润率,并psi为真实几率。x当真几率是1时,让我们计算密度为0到4(所有边距等于4):

install.packages("MCMCpack")
library(MCMCpack)
sapply(0:4, function(x) dnoncenhypergeom(x, n1=4, n2=4, m1=4, psi=1))

这样产生:

[1] 0.01428571 0.22857143 0.51428571 0.22857143 0.01428571

因此,在原假设下,女士有8个正确的猜测(即,她正确猜测所有4杯首先添加茶的位置,因此她也正确猜测所有4杯所有牛奶的位置)的概率为1.43%。实际上,这是Fisher认为足以拒绝原假设的证据量。

问题中指定的概率可用于计算比值比,即(即)。现在,这位女士有什么机会正确猜出所有8杯(即,她将正确猜出所有4杯在先添加茶的位置,因此也猜对所有4杯在正确添加牛奶的位置)?赔率A |A /赔率A |B (.90/(1.90))/(.10/(1.10))=81odds(guessA|trueA)/odds(guessA|trueB)

dnoncenhypergeom(4, n1=4, n2=4, m1=4, psi=81)

这样产生:

[1] 0.8312221

因此,功率约为83%。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.