基于对Ben答案的评论,我将对Monty Hall的这种变体提供两种不同的解释,与Ruben van Bergen的不同。
我将第一个称为Liar Monty,第二个称为Unreliable Monty。在这两个版本中,问题均按如下方式进行:
(0)有三扇门,其中一扇是汽车,另一扇是山羊,后面是随机分布的门。
(1)参赛者随机选择一扇门。
(2)蒙蒂(Monty)挑起与参赛者的门不同的门,并声称后面有山羊。
(3)向参赛者提供切换到未挑起的第三扇门的问题,问题是“参赛者应何时切换以最大化在门后找到汽车的可能性?”
在Liar Monty中,在步骤(2)中,如果参赛者选择了包含山羊的门,则Monty会以某种预定义的概率选择包含汽车的门(即,在0到100%之间,他会撒谎山羊在某些门后面。请注意,在此变体中,如果参赛者在步骤(1)中选择了汽车,蒙蒂就不会选择装有汽车的门(即不能撒谎)。
在“不可靠的蒙蒂”中,存在一个预先确定的可能性,即步骤(2)中蒙蒂选择的门包含一辆汽车。我从您对Ben的回答的评论中得知,这是您感兴趣的场景,并且我的两个版本都与Ruben van Bergen的版本不同。请注意,不可靠的蒙蒂与说谎者蒙蒂并不相同;稍后我们将严格区分这两种情况。但想一想,在这种情况下,蒙蒂的大门永远不能包含汽车超过的时间,因为参赛者有选择车的概率的时间。2313
为了回答这个问题,我们将不得不使用一些方程式。我将尝试说出我的答案,以便可以访问。我希望不要混淆的两件事是符号的代数操作和条件概率。对于前者,我们将使用符号来表示以下内容:
SS¯MM¯CC¯=The car is behind the door the contestant can switch to.=The car is not behind the door the contestant can switch to.=The car is behind the door Monty chose.=The car is not behind the door Monty chose.=The car is behind the door the contestant chose in step (1).=The car is not behind the door the contestant chose in step (1).
我们使用表示“的概率”,因此,总的来说,类似意味着汽车不在Monty选择的门后面。(即,无论您在哪里看到涉及符号的表达式,都应将其替换为“英语”等价物。)Pr(∗)∗Pr(M¯)
我们还需要对条件概率有一些基本的了解,如果您了解其他相关事件,则大概是某件事发生的概率。此概率将在此处由等表达式表示。竖线可以认为是“如果您知道”的表达方式,因此可以理解为“参赛者可以切换到拥有车门的概率,如果您知道汽车不在Monty的门后面。在最初的Monty Hall问题中,,大于,它对应于Monty没有提供任何信息的情况。Pr(S|M¯)|Pr(S|M¯)Pr(S|M¯)=23Pr(S)=13
我现在将证明不可靠的蒙蒂等同于骗子蒙蒂。在骗子蒙蒂中,我们得到了数量,这是蒙蒂知道参赛者未选择汽车的情况下蒙蒂躺在他门上的概率。在不可靠的蒙蒂中,我们得到了的数量,即蒙蒂躺在他的门上的概率。使用条件概率的定义,然后重新排列,我们得到:Pr(M|C¯)Pr(M)PR (中号 和 ˉ Ç Pr(M and C¯)=Pr(C¯|M)Pr(M)=Pr(M|C¯)Pr(C¯)
Pr(M)32Pr(M)=Pr(M|C¯)Pr(C¯)Pr(C¯|M)=Pr(M|C¯),
由于导致,汽车出现概率为没有落后的选手的选择门和,这辆车是不是选手的选择门的后面,如果我们知道它的背后是蒙蒂的门的概率,是一个。Pr(C¯)23Pr(C¯|M)
因此,我们显示了不可靠的蒙蒂(由以上等式的LHS表示)和骗子蒙蒂(由RHS表示)之间的联系。在极端不可靠的蒙蒂的极端情况下,蒙蒂选择了隐藏车门的车门,这相当于蒙蒂一直躺在骗子蒙蒂,如果参赛者本来是捡山羊的。23
显示了这一点之后,我现在将提供足够的信息来回答蒙蒂·霍尔问题的骗子版本。我们要计算。使用总概率定律:Pr(S)
Pr(S)=Pr(S|C)Pr(C)+Pr(S|C¯ and M)Pr(C¯ and M)+Pr(S|C¯ and M¯)Pr(C¯ and M¯)=Pr(C¯ and M¯)
因为 且(说服自己!)。Pr(S|C)=Pr(S|C¯ and M)=0Pr(S|C¯ and M¯)=1
继续:
Pr(S)=Pr(C¯ and M¯)=Pr(M¯|C¯)Pr(C¯)=23−23Pr(M|C¯))
因此,您会看到,当Monty总是撒谎(aka)时,如果您始终切换,则获胜的机会为零,而如果他从不撒谎,则汽车落后的几率您可以切换到的门是。Pr(M|C¯))=1Pr(S)23
由此,您可以为骗子和不可靠的蒙蒂制定最佳策略。
附录1
在回应评论时(强调我的):
“我在@alex的评论中添加了更多详细信息-Monty从来没有敌对也不会屈服,只是犯错,因为有时他可能由于任何原因而犯错,并且从不开门。研究表明,Monty犯了大约33.3%的错误时间,然后汽车实际上就在那儿。那是正确率的后验概率,正确率是66.6%,蒙蒂从未选择您的车门,您也不会选择他的车门。这些假设会改变什么吗?”
据我了解,我的答案开始时引入了不可靠的蒙蒂霍尔问题。
因此,如果蒙蒂的门上装有时间的汽车,那么当您切换到最后一个未捡起的门时,我们就有获胜的几率:13
Pr(S)=23−23Pr(M|C¯)=23−23×32Pr(M)=23−13=13
因此,切换到保留原来的门还是切换到Monty选择的门(符合您的直觉)之间没有区别。