易失性蒙蒂的蒙蒂霍尔问题


23

蒙蒂非常了解门后面是否有山羊(或者是空的)。这一事实允许玩家通过将“猜测”切换到另一扇门来使成功率随时间翻倍。如果蒙蒂的知识还不够完善怎么办?如果有时奖品确实和山羊同在一个门口,该怎么办?但是直到选择并打开门后您才能看到它?当蒙蒂的准确率低于100%时,玩家可以帮助我了解如何计算IF以及提高多少?例如:如果蒙蒂错了-平均50%的时间呢?玩家仍然可以从切换他的猜测/门中受益吗?我想如果Monty获胜的可能性不超过33.3%,那么奖品就不会落在门后,那么玩家最好的选择就是不要切换他的门选择。您能否为我提供一种方法,通过插入不同的蒙提正确概率(关于奖品不在门后)来计算转换的潜在利益?我除了高中数学外没有其他东西,今年69岁,所以请保持谦虚。


感谢您提供的见解和公式。如果“ Fallible Monty”在预测没有奖品/汽车的情况下准确率只有66%,那么从您最初选择的车门切换为零收益是...。因为默认值为33%奖品的基本费率位于任何门后。但是,有人认为,如果蒙蒂在预测没有奖品的情况下胜过66%,那么切换会产生更大的效用。我将尝试将这种推理应用于“专家”做出“专家预测”的游戏,即三个大致相同的选项之一将是正确的。我对专家的正确性几乎没有信心,我可以肯定他的“命中率”将小于33%-更像是15%。我的结论是,当“同样的选择,因为我,我可能是错的肯定,而应换另两个中的一个!;-)


5
如果Monty的准确度低于100%,是否就意味着他有时会在背后开奖呢?如果是这样,您可能应该选择那扇门。
传真

Answers:


35

让我们从常规的Monty Hall问题开始。三扇门,其中一扇是汽车。另外两个后面有山羊。您选择1号门,Monty打开2号门,向您显示后面有一只山羊。您是否应该将猜测切换到3号门?(请注意,此处用于指代每个门的数字并不重要。我们可以选择任何顺序,并且问题是相同的,因此为了简化起见,我们可以使用此数字。)

正如您已经知道的那样,答案当然是肯定的,但是让我们看一下计算以了解它们以后如何变化。令为汽车车门的索引,而代表蒙蒂透露2号门有山羊的事件。我们需要计算。如果此值大于,则需要将我们的猜测切换到该门(因为我们只有两个剩余选项)。该概率由下式给出: (这只是应用Bayes规则,且上有一个先验先平。)等于1:如果汽车在3号门后面,那么Monty别无选择,只能打开门号2就像他一样。CMp(C=3|M)1/2

p(C=3|M)=p(M|C=3)p(M|C=1)+p(M|C=2)+p(M|C=3)
Cp(M|C=3)p(M|C=1)1/2p中号|C=2pC=3|M等于:如果汽车在1号门后面,则Monty可以选择打开其余2个或3个门中的一个等于0,因为Monty从未打开过他要打开的门知道有车。填写这些数字,我们得到: 这是我们熟悉的结果。1/2p(M|C=2)
p(C=3|M)=10.5+0+1=23

现在,让我们考虑一下蒙蒂不完全了解哪扇车门的情况。因此,当他选择自己的门(我们将其继续称为2号门)时,他可能会不小心选择了装有汽车的那扇门,因为他认为门有一只山羊。设为Monty 认为拥有汽车的门,而让为他认为该汽车位于某个特定位置(取决于其实际位置的概率。我们假设这由确定其准确性的单个参数来描述,例如:。如果等于1,蒙蒂永远是对的。如果C p ç ' | C ^ q p C ^ ' = X | C ^ = X = q = 1 - p ç 'X | C ^ = X q q q 1 / 3p(C|C)qp(C=x|C=x)=q=1p(Cx|C=x)qq为0,则Monty总是错误的(仍然有用)。如果为,则Monty的信息不会比随机猜测更好。q1/3

这意味着我们现在有:

p(M|C=3)=xp(M|C=x)p(C=x|C=3)
=p(M|C=1)p(C=1|C=3)+p(M|C=2)p(C=2|C=3)+p(M|C=3)p(C=3|C=3)
=12×12(1q)+0×12(1q)+1×q
=14q4+q=34q+14

也就是说,如果汽车确实在3号门的后面,那么可能会出现三种可能性:(1)Monty认为它在1号后面,(2)Monty认为2或(3)Monty认为3号。最后一种选择是概率为(多久正确一次),其他两个人在他们之间将错误的概率分开。那么,在每种情况下,像他那样,他会选择指向2号门的概率是多少?如果他认为汽车落后于1,那么概率是1比2,因为他可以选择2或3。如果他认为汽车落后于2,他将永远不会选择指向2。如果他认为汽车落后于3。 ,他总是会选择2。q(1q)

我们可以类似地计算出剩余概率:

p(M|C=1)=xp(M|C=x)p(C=x|C=1)
=12×q+1×12(1q)
=q2+12q2=12

p(M|C=2)=xp(M|C=x)p(C=x|C=2)
=12×12(1q)+1×12(1q)
=3434q

填充全部内容,我们得到: 作为健全性检查,当,我们可以看到我们得到了原始答案。

p(C=3|M)=34q+1412+3434q+34q+14
=0.75q+0.251.5
q=111.5=23

那么,我们什么时候切换?为了简单起见,我假设不允许我们切换到Monty指向的门。而且事实上,只要Monty至少一定程度上是正确的(比随机猜测更重要),他所指的门总是比其他人拥有汽车的可能性小,因此这不是一个可行的选择反正对我们来说。因此,我们只需要考虑1号门和3号门的概率。但是,以前汽车不可能在2号门后面,此选项现在具有非零概率,因此不再需要切换当,相反,当(过去是同一件事)时,我们应该进行切换。该概率由p(C=3|M)>0.5p(C=3|M)>p(C=1|M)p(C=1|M)=0.51.5=13,与原始的Monty Hall问题相同。(这是有道理的,因为Monty永远不会指向门1,无论门后面是什么,因此他都无法提供有关该门的信息。相反,当他的准确度降至100%以下时,结果是有些概率“泄漏”了门。 2实际上拥有汽车。)因此,我们需要找到,使得: qp(C=3|M)>13

0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
因此,基本上,这是一个漫长的发现过程,只要蒙蒂对汽车的真实位置的了解胜于随机猜测,就应该打开车门(考虑到它,这实际上是显而易见的) )。我们还可以根据蒙蒂的准确度来计算切换时获胜的可能性,其计算公式如下: (其中,当,给出的答案为2,与我们通过在最初的Monty Hall问题中切换门来使获胜的机会加倍。)
p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
q=1

编辑:人们在询问允许我们切换到Monty指向的门的场景,当,即Monty是(某种程度上)可靠的“骗子” 时,这变得很有优势。在最极端的情况下,当,这意味着Monty认为确实有门确实有山羊。但是请注意,其余两扇门仍然可以是汽车或山羊。q<13q=0

切换到门2的好处如下: 如果,即,那么它仅大于1(因此值得切换到该门)转折点已经确定。有趣的是,与原来的Monty Hall问题(当)的获胜几率翻倍相比,当时切换到2号门的最大可能收益仅为1.5 。

p(C=2|M)p(C=1|M)=0.750.75q1.513=1.51.5q
1.5q<0.5q<13q=0q=1

通过组合这两种切换策略可以得出一般的解决方案:当,您总是切换到3号门;否则,请切换至门2。 q>13


当时q < 1/3,期望值实际上不会回升吗,因为它不是在建模他准确的可能性,而是在建模他出错的可能性?当接近0时,这意味着他会一直撒谎,而您期望的收益将回到2/3
Cireo

2
@Cireo他不会撒谎,他只是错了。说谎意味着他知道自己的回答是错误的。我怀疑期望值不会回升的原因是因为他无意中指着后面有车的车门(即p(M | C = 2)正在上升)而您无法选择那扇门,无论如何)。q = 0意味着他总是记不清汽车的位置,即他现在有很大的机会指着汽车后面的车门。
布曼

3
更普遍的解决方案(显然需要这样做)包括“敌对的”蒙蒂;根据您选择的是山羊还是汽车来改变他指向的对象(甚至他指向的对象)。
Yakk

3
@Yakk:您可以想象有无数种方案可以无限多种方式改变赔率。这还取决于您是否知道Monty的运作方式。如果您知道他是敌对的,那么实际上他不能将您的赔率降低到1/3以下,因为您将决定忽略他的所作所为。如果您不知道他的决策过程,那么这完全取决于您所做的假设以及他所做的确切工作,并且那里有很多自由度。
Ruben van Bergen

1
@KalevMaricq:我并不是真的在说蒙蒂。问题在于汽车可能会在您最初选择的门后面,而蒙蒂是不允许选择的(否则,我认为这不再是蒙蒂·霍尔的问题)。因此,他可能只有两个山羊门可供选择,在这种情况下,他不能撒谎说其中之一后面有一只山羊。因此,我认为不可能在问题的范围内构建一个真正的“骗子蒙蒂”。相反,我去了(对于)是一个蒙蒂,他总是把山羊门误认为车门,但是我们不知道哪个山羊门。q=0
Ruben van Bergen

7

这应该是问题的一个相当简单的变化(尽管我注意到您的数学背景有限,所以我认为这是相对的)。我建议您首先尝试确定解决方案的条件,以 Monte是否正确无误还是完全错误为准。第一种情况只是普通的蒙特霍尔问题,因此那里不需要做任何工作。在第二种情况下,您会将他选择的门视为包括奖品的门在所有门中都是随机的(即,他可能仍然选择没有奖品的门,但这现在是随机的)。如果您可以计算出每种情况下的获胜概率,则可以使用总概率定律 确定在蒙特具有某种特定级别的易失性(由我们是绝对可靠还是完全易犯的概率指定)的情况下的相关获胜概率。


2
感谢您的回应,但我正在寻找更具体的内容。我指定的是Monty选择了一扇门。我指定的是,奖品在那扇门后面的概率可能为零到100%。我希望有一个公式,可以让我简单地输入Monty是对/错的概率,然后计算出公式的其余部分将提供一个数值估计,该数值指示切换将导致获胜的概率。这样的援助程度是不切实际的要求吗?
Pseudoego

4

基于对Ben答案的评论,我将对Monty Hall的这种变体提供两种不同的解释,与Ruben van Bergen的不同。

我将第一个称为Liar Monty,第二个称为Unreliable Monty。在这两个版本中,问题均按如下方式进行:

(0)有三扇门,其中一扇是汽车,另一扇是山羊,后面是随机分布的门。

(1)参赛者随机选择一扇门。

(2)蒙蒂(Monty)挑起与参赛者的门不同的门,并声称后面有山羊。

(3)向参赛者提供切换到未挑起的第三扇门的问题,问题是“参赛者应何时切换以最大化在门后找到汽车的可能性?”

在Liar Monty中,在步骤(2)中,如果参赛者选择了包含山羊的门,则Monty会以某种预定义的概率选择包含汽车的门(即,在0到100%之间,他会撒谎山羊在某些门后面。请注意,在此变体中,如果参赛者在步骤(1)中选择了汽车,蒙蒂就不会选择装有汽车的门(即不能撒谎)。

在“不可靠的蒙蒂”中,存在一个预先确定的可能性,即步骤(2)中蒙蒂选择的门包含一辆汽车。我从您对Ben的回答的评论中得知,这是您感兴趣的场景,并且我的两个版本都与Ruben van Bergen的版本不同。请注意,不可靠的蒙蒂与说谎者蒙蒂并不相同;稍后我们将严格区分这两种情况。但想一想,在这种情况下,蒙蒂的大门永远不能包含汽车超过的时间,因为参赛者有选择车的概率的时间。2313

为了回答这个问题,我们将不得不使用一些方程式。我将尝试说出我的答案,以便可以访问。我希望不要混淆的两件事是符号的代数操作和条件概率。对于前者,我们将使用符号来表示以下内容:

S=The car is behind the door the contestant can switch to.S¯=The car is not behind the door the contestant can switch to.M=The car is behind the door Monty chose.M¯=The car is not behind the door Monty chose.C=The car is behind the door the contestant chose in step (1).C¯=The car is not behind the door the contestant chose in step (1).

我们使用表示“的概率”,因此,总的来说,类似意味着汽车不在Monty选择的门后面。(即,无论您在哪里看到涉及符号的表达式,都应将其替换为“英语”等价物。)Pr()Pr(M¯)

我们还需要对条件概率有一些基本的了解,如果您了解其他相关事件,则大概是某件事发生的概率。此概率将在此处由等表达式表示。竖线可以认为是“如果您知道”的表达方式,因此可以理解为“参赛者可以切换到拥有车门的概率,如果您知道汽车不在Monty的门后面。在最初的Monty Hall问题中,,大于,它对应于Monty没有提供任何信息的情况。Pr(S|M¯)|Pr(S|M¯)Pr(S|M¯)=23Pr(S)=13

我现在将证明不可靠的蒙蒂等同于骗子蒙蒂。在骗子蒙蒂中,我们得到了数量,这是蒙蒂知道参赛者未选择汽车的情况下蒙蒂躺在他门上的概率。在不可靠的蒙蒂中,我们得到了的数量,即蒙蒂躺在他的门上的概率。使用条件概率的定义,然后重新排列,我们得到:Pr(M|C¯)Pr(M)PR 中号 和  ˉ Ç Pr(M and C¯)=Pr(C¯|M)Pr(M)=Pr(M|C¯)Pr(C¯)

Pr(M)=Pr(M|C¯)Pr(C¯)Pr(C¯|M)32Pr(M)=Pr(M|C¯),
由于导致,汽车出现概率为没有落后的选手的选择门和,这辆车是不是选手的选择门的后面,如果我们知道它的背后是蒙蒂的门的概率,是一个。Pr(C¯)23Pr(C¯|M)

因此,我们显示了不可靠的蒙蒂(由以上等式的LHS表示)和骗子蒙蒂(由RHS表示)之间的联系。在极端不可靠的蒙蒂的极端情况下,蒙蒂选择了隐藏车门的车门,这相当于蒙蒂一直躺在骗子蒙蒂,如果参赛者本来是捡山羊的。23

显示了这一点之后,我现在将提供足够的信息来回答蒙蒂·霍尔问题的骗子版本。我们要计算。使用总概率定律Pr(S)

Pr(S)=Pr(S|C)Pr(C)+Pr(S|C¯ and M)Pr(C¯ and M)+Pr(S|C¯ and M¯)Pr(C¯ and M¯)=Pr(C¯ and M¯)
因为 且(说服自己!)。Pr(S|C)=Pr(S|C¯ and M)=0Pr(S|C¯ and M¯)=1

继续:

Pr(S)=Pr(C¯ and M¯)=Pr(M¯|C¯)Pr(C¯)=2323Pr(M|C¯))

因此,您会看到,当Monty总是撒谎(aka)时,如果您始终切换,则获胜的机会为零,而如果他从不撒谎,则汽车落后的几率您可以切换到的门是。Pr(M|C¯))=1Pr(S)23

由此,您可以为骗子和不可靠的蒙蒂制定最佳策略。

附录1

在回应评论时(强调我的):

“我在@alex的评论中添加了更多详细信息-Monty从来没有敌对也不会屈服,只是犯错,因为有时他可能由于任何原因而犯错,并且从不开门。研究表明,Monty犯了大约33.3%的错误时间,然后汽车实际上就在那儿。那是正确率的后验概率,正确率是66.6%,蒙蒂从未选择您的车门,您也不会选择他的车门。这些假设会改变什么吗?”

据我了解,我的答案开始时引入了不可靠的蒙蒂霍尔问题。

因此,如果蒙蒂的门上装有时间的汽车,那么当您切换到最后一个未捡起的门时,我们就有获胜的几率:13

Pr(S)=2323Pr(M|C¯)=2323×32Pr(M)=2313=13

因此,切换到保留原来的门还是切换到Monty选择的门(符合您的直觉)之间没有区别。


Alex和@Ruben van Bergen等人。感谢您提供有用的详细信息。假设蒙蒂从不敌对,只是容易犯错,并告诉您“我很确定汽车不在这扇门后面。” 但没有打开门。假设研究表明他在大约33.3%的时间内犯了错误,因此正确率为66.6%(后验概率?)。切换仍然有一些好处,但是一旦他的准确率仅达到33.3%,那么切换到HIS门或另一扇门就没有意义了。从字面上看是“您的猜想和我的猜想一样好”。这会改变您的分析或公式吗?
Pseudoego

不,这不会改变我的分析。我添加了一些内容,希望可以在您的评论中澄清该问题。顺便说一句,我不会对“敌对”,“易犯错误”,“蒙太奇谎言”一词读得太多。除非精确定义为蒙蒂关于装有山羊皮门的(有条件的)概率,否则这些实际上并没有任何意义。
亚历克斯

很生气,我对我自己的问题的回答将被删除,唯一的解释是该站点不是为了“讨论”-当我主要解释为什么我认为到目前为止给出的答案是正确的时,并解释了他们将如何做有用。在给出的大多数其他答案中,还有更多的讨论。对我来说,这似乎是近视的-充其量是-愚蠢的-最坏的是-删除某人对自己问题的答案:您怎么能解释为什么不将其评为最佳答案而又不进行讨论?感谢所有答复的人。
伪世界

@Pseudoego您最后的评论最好是对原始问题的评论。我没有看到您的答案,但听起来您想讨论现有的答案,在这种情况下,您可以修改原始问题。
Alex

0

出于某种原因,主持人决定删除我对自己问题的答案,理由是该答案包含“讨论”。我真的看不出我如何能解释什么是最佳答案,而无需讨论使它对我有用的方法以及如何将其应用于实践。

我感谢以前的答案中提供的见解和公式。这似乎是IF “容易犯错的蒙蒂”在预测没有奖励/汽车只有66%的准确THEN 有ZERO利于从原来的门的开关选择....因为他的33%的错误率是默认奖品的基本费率位于任何门后。但是,有人认为,IF Monty在预测没有奖品的情况下会胜过66%,然后切换会产生更大的效用。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.