您观察到n次投掷k个头。硬币公平吗?


13

在一次采访中我被问到。有没有“正确”的答案?(n,k)=(400,220)

假设抛掷是同性的,正面的概率为。那么,在400次抛掷中头部的分布应该接近于法线(200,10 ^ 2),这样220头部的平均值就会偏离平均值2个标准差。观察到这种结果的可能性(即,在任一方向上均距平均值多2个SD)略小于5%。p=0.5

面试官告诉我,基本上,“如果我观察到均值> = 2 SD,就会得出结论,其他事情还在继续。我敢打赌这枚硬币是公平的。” 这是合理的-毕竟,这就是大多数假设检验所做的。但这就是故事的结局吗?对于面试官来说,这似乎是“正确”的答案。我要问的是,有些细微差别是否合理。

我忍不住指出,在这种抛硬币的情况下,判定硬币不公平是一个奇怪的结论。我说对吗?我会在下面解释。

首先,我-我也会假设大多数人-对硬币有很深的了解:它们很可能是公平的。当然,这取决于我们所说的公平-一种可能性是将“公平”定义为“具有接近0.5(例如介于0.49和0.51之间)的可能性”。

(你也可以定义“公平”为指的正面的概率正好是0.50,在这种情况下,有一个完全公平的硬币现在似乎相当取消可能。)

您的先验可能不仅取决于您对硬币的一般看法,还取决于上下文。如果您从自己的口袋里掏出硬币,那么您几乎可以肯定这是公平的。如果您的魔术师朋友从他的钱包中拿出硬币,那么您以前的朋友可能会加大双头硬币的重量。

无论如何,要想出一个合理的先验就很容易了:(i)使硬币很可能是公平的;(ii)即使观察了220个头,也使后验非常相似。然后,您会得出结论,尽管观察到结果均值2 SD,但该代币很可能是公平的。

实际上,您还可以构建一些示例,其中在400次抛掷中观察220个头,这会使您的后方对硬币保持更大的重量,例如,如果所有不公平的硬币的正面概率都为。{0,1}

谁能为我阐明一下?


在写完这个问题之后,我想起了我以前听说过这种大局的情况,这不是林德利的“悖论”吗?

Whuber在评论中加入了一个非常有趣的链接:您可以装模,但不能偏向硬币。从第3页:

不能说硬币的正面概率为p,因为硬币可以完全由抛掷的方式确定,除非将硬币抛向空中并快速旋转并抛向空中。无弹跳,在这种情况下,p = 1/2。

太酷了!这以一种有趣的方式与我的问题联系在一起:假设我们知道硬币被“迅速旋转抛向空中,并被弹跳而没有跳动”。那么我们绝对不应该拒绝硬币是公平的假设(这里的“公平”现在意味着“以上述方式抛硬币时,p = 1/2”),因为我们有效地拥有了将所有概率置于硬币是公平的。也许在某种程度上可以证明为什么在观察到220个头之后我不愿意拒绝null。


1
如果您要将“硬币”解释为您没有先验知识的二进制过程的隐喻,您的问题的任何部分都会改变吗?
whuber

1
@whuber这是一个很好的问题。我认为在那种情况下,我更愿意采用“当p <= 0.05时拒绝”,尽管我不确定如何证明这一点对我自己是正确的。
阿德里安

困扰我的另一个问题是,提出问题的人对p = 0.50的假设很感兴趣。但是,如果您认为p是连续分布的,则无论您观察到什么,概率都将为零。做出关于p属于某个时间间隔的陈述,对我来说更有意义。例如,在我没有先验知识并决定使用统一先验的情况下,这将是一个问题。
阿德里安

3
这说得通。但是,以硬币为中心的问题有点让人分心,因为对此类问题的答案通常会转移到对硬币翻转的物理学(和手法)的讨论中。你可能会在实际情况如何相反是你坚强的先验,这取决于震惊如何硬币翻转。“说硬币有概率为正面的是没有道理的”p
whuber

1
@Adrian DJC MacKay在他的免费教科书中的以下链接上讨论了这个确切的问题(n = 250,k = 140):inference.phy.cam.ac.uk/itprnn/book.pdf(p63。)读他说的话。他得出的结论与您相似。
Flounderer 2014年

Answers:


4

解决此问题的标准贝叶斯方法(无正态近似)是明确声明您的先验,并将其与您的可能性(Beta分布)结合起来。然后将您的后视点积分约50%,比如说两个标准差,或者说是49%–51%或您喜欢的任何东西。

如果您先前的信念在[0,1]上是连续的,例如Beta(100,100)(这使大量质量的硬币大致上是公平的),那么该硬币是公平的概率为零,因为可能性也是连续的[0 ,1]。

即使硬币是公平的概率为零,您通常也可以在偏斜后验时回答您要回答的任何问题。例如,给定硬币概率的后验分布,赌场边缘是多少?


1
+1,但我想补充一下这个答案。假设我们按照OP的建议将公平硬币定义为,那么在这种情况下,我们希望将我们的先验概率定为。那么合理的先验是,因此给定问题中的数据,后验分布变为并且公平硬币的后验概率仍然非常大:0.49<p<0.5199%pBeta(8300,8300)
P(p(0.49,0.51))=0.99003.
p|dataBeta(8300+220,8300+180)
P(p(0.49,0.51)|data)=0.9886.
knrumsey

2

假设是伯努利分布,在这种情况下是抛硬币。

显然,这是一个二项式分布,并且确实接近B(n=400,p=0.5)N(μ=200,σ2=100)

k95%B(n=400,p=0.5)pB(n=400,p=0.5,k=220)

p=0.5π(p=0.5)=0.5π(p0.5)=0.5

π(0.49p0.51)=0.9π(p<0.49p>0.51)=0.1p

P(0.49p0.51|k=220)

pN(μ=0.5,σ2=0.25)σ2=0.1

pf(p|k=220)


我的声誉不足以让我在“问题”下写评论。取而代之的是我要在这里写一些关于“ 你不能偏向硬币”的文章。@阿德里安

这就是我们所拥有的

  1. B(n=400,k=220,p=θ)
  2. 理论和实验研究你不能偏向硬币

这是我们的假设

H0:θ^=0.5

H1

这是我们的结果

  1. H0
  2. H1

pH0H1

否则,我们将在此处为假设检验创建双重标准。我们不能接受抛硬币公平实验数据正确记录的假设。


说硬币的正面概率为p是没有道理的

我们有实验结果来支持这一假设。

pN(μ=0.5,σ2)

σs


1
张谢谢你 一个小巧的建议:如果您想在先于概率的情况下使用先验正态分布,我想您应该截断它,以便p位于[0,1]中。
阿德里安

当然,有许多合理的先验分布和相应的后验。我的问题的实质是更笼统的:在这种抛硬币的情况下,认为硬币不公平似乎是一个奇怪的结论。您对此有何看法-为什么?
阿德里安

Beta分布是一个方便的先验,因为它与二项式似然共轭。但同样,我的问题的真正主旨比具体的先验问题更为笼统。
阿德里安

π(p=0.5)pU(0,1)E(p)f(p|k=220)p=0.5E(p)。我们很容易接受硬币不公平的假设。特别是在这种情况下,您不会发现将硬币认为是不公平的结论。
张子ao 2014年

@ user777正态分布在Zhang的响应中出现两次,首先是近似二项式(极大),其次是出现概率的先验(当他说“先验是正态分布p〜N”时)。张-您对Null表示“硬币是公平的并且数据已正确记录”的编辑很有趣,谢谢您的发布。
阿德里安
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.