布莱克威尔的赌注


12

我已经读过布莱克韦尔关于“ 徒劳壁橱”的赌注悖论。这是摘要:您将两个信封和。信封中有随机的钱,但是您对钱的分配一无所知。您打开一个,检查其中有多少钱(),然后必须选择:拿信封或?ExEyxExEy

徒劳的壁橱指的是一个叫伦纳德·瓦普纳(Leonard Wapner)的数学家:“出乎意料的是,除了打开另一个信封,您可以做一些事情,以使自己获得比正确解决方案更好的机会。”

这个想法对我来说似乎是错误的,它如下:选择一个随机数。如果,则取。如果,请选择。dd<xExd>xEy

Wapner:“如果d介于x和y之间,那么您的预测(如d所示)将保证是正确的。假设这以概率p发生。如果d小于x和y,那么只有在您选择的数字x大于两个时,您的预测才是正确的。有50%的机会。同样,如果d大于两个数字,则仅当您选择的数字小于两个数字时,您的预测才是正确的。发生这种情况的可能性也为50%。”

如果在的概率大于零,则此方法的平均成功率为。这意味着通过观察不相关的随机变量可以提供更多信息。d[x,y]12+p2

我认为这都是错误的,问题出在选择随机整数。这是什么意思?像是整数?在这种情况下,概率即谎言之间和为零,因为这两个和是有限的。d X ÿ X ÿpdxyxy

如果说有关于钱的最大量的限制,说,或者至少我们选择从D,然后配方归结为选择的琐碎建议如果和如果则选择。1 ... 中号Ë ý X < 中号/ 2 ë X X > 中号/ 2M1...MEyx<M/2Exx>M/2

我在这里想念什么吗?

编辑

好的,现在我开始看看明显的矛盾来自何处。在我看来,不相关的随机变量无法提供附加信息。

但是,请注意,我们需要有意识地选择d的分布。例如,选择均匀分布的边界或Poissionian分布的等。显然,如果我们在玩花生游戏,我们选择d的分布在美元,。最后一个概率将首先取决于我们对信封中可能存在的内容的判断。[ 10 92 10 9 ] P d X ÿ = 0λ[109,2109]P(d(x,y))=0

换句话说,如果该技术有效,则违反了我们不知道信封中货币的分布(如何选择信封中的货币数量)的假设。但是,如果我们真的不知道信封里有什么,那么在最坏的情况下,我们不会通过应用它来丢掉任何东西。

编辑2

另一个想法。给定,让我们为绘制选择一个连续的非负分布,使得。我们可以这样做,对吗?我们按照指示进行-如果,则保留包络线;如果,则更改包络线。推理不会改变,取决于我们如何选择分布,可以是(或者我弄错了吗?)。d P d < X = P d > X d < X d > X P d [ X ÿ ] > 0xdP(d<x)=P(d>x)d<xd>xP(d[x,y])>0

但是,考虑到我们如何选择分布,我们现在所做的等同于抛硬币。我们扔一个硬币,如果是正面,我们会换信封,如果是正面,我们会贴在我们拿着的信封上。我哪里错了?

编辑3

好,我明白了。如果我们将的概率函数基于(例如,我们从范围的均匀分布中采样,则概率不独立于。X d 1 2 X P d X ÿ P 正确的决定| d X ÿ dxd(1,2x)P(d(x,y))P(correct decision|d(x,y))

因此,如果(概率为),则猜测总是正确的,就像以前一样。如果是下数,但是,和,比具有较高的几率为低于不是被高于,因此,我们对不正确的决定偏置。当是两个数字中的较高者时,适用相同的推理。p X d X ÿ d X X Xd(x,y)pxd(x,y)dxxx

这意味着我们必须独立于选择绘制的过程。换句话说,我们需要猜测从中得出和的分布参数;发生的最糟糕的情况是我们仍然会随机猜测,但是发生的最好的情况是我们的猜测是正确的-然后我们就有了优势。这比猜测“ x和y至少为1 $,但最多为10 $ ”如何更好,所以如果,我们将其保留,否则,我们将其交换。”看到。x x y x > 5dxxyx>5

在Wapner的书(意料之外的期望:数学水晶球的好奇心)中,流行科学对问题的表述使我误入歧途。

“以任何手段,选择一个随机正整数”(暗示瓦普纳一个几何分布-抛硬币,直到第一头上来,重复该过程,如果)“如果猜测更高和如果猜测更低。(...)您会正确地猜出50%以上的时间,因为正确地猜想所占的时间超过50%!”d > x d < x dd=xd>xd<xd



2
这与两个包络问题完全不同,其意义在于:(1)给出用于切换两个包络问题的论点是谬误的,可以通过在前面加上贝叶斯先验而看到论点的缺陷,而(2) Wapner对于Blackwell的下注给出的结论是正确的。
马修·冈恩

如果钱信封的金额是一组数字中的任意元素S,对于瓦普纳的战略工作的充分必要条件是你选择的数量的CDF进行严格增加了对S.
恢复莫妮卡

好的,我仍然缺少一些东西-请看我的EDIT 2,但根据推理,在我看来,我们好像可以抛硬币,它仍然可以工作。我哪里错了?
1

Answers:


8

这被广泛称为二包络问题。通常,金额以和给出,但并非必须如此。2 AA2A

一些要点:

  1. 不能统一选择一个随机整数*,但是引用的部分似乎并不要求其统一。选择分布-参数的大小无关紧要-只要它有可能超过任何有限值。

  2. 用引用的决策规则选择整数是没有意义的,因为金钱是离散的,这意味着机会非零,并且在这种情况下没有列出任何东西。(或者,修改规则以指定相等时的操作)d = xd d=x

  3. 抛开这些,您可以从一些非负连续分布中选择,那么我们不必担心相等性。d

*(也不能选择均匀随机的非负整数或均匀随机的正整数)


如果我们说对最大金额有一个限制,例如,或者至少我们从选择,那么该归结为如果并且选择的简单建议。如果则选择d 1 ... 中号Ë ý X < 中号/ 2 ë X X > 中号/ 2Md1...MEyx<M/2Exx>M/2

如果事实证明从中选择的随机分布包含则应该起作用(比50-50好);如果分配卡在一半,则不会。M / 2xM/2

但是,我最初介绍的这个游戏的版本是信封是由(可能)试图使您从游戏中获得的收入最小化的人提供的。在这种情况下,仍然可以使用使用分发来决定是否切换到其他信封的策略。


好的,记分(1-3)。因此,我可以选择这种随机,非负,连续分布,使得正确吗?但随后的决定基本上是基于抛硬币...我错了吗?P d < x = P d > x dP(d<x)=P(d>x)
1

您根本不需要。您只需要在两个量之间获得一些非零的概率即可。P(d<x)=P(d>x)
Glen_b-恢复莫妮卡

是的,但是我可以根据需要定义的密度函数,对吗?我这样做是为了使论点得出荒谬的结论。d
1

通过将策略设为x的函数,当d在x和y之间时,您没有赋予自己做出正确选择的优势-您正在定义赢得比赛的出路。如果您提供的链接声称这种策略有效,那么它们将是错误的
Glen_b -Reinstate Monica

用Wapner的推理,是什么使我无法定义用来推导作为的函数的概率函数?只要,他的推理就仍然有效,我错了吗?如果我使用包含的连续非负分布(例如上的均匀分布,那么可以保证是这种情况。如果。dxP(d(x,y))>0x(1,2x)d(x,y)
一月

7

Wapner的说法是正确的!

一些评论:

  • 按照所描述的截止策略,如果在事前预期中最坏的情况下是无用的,我们将切换包络。选择,它会非常有用。x<dd
  • 如果添加贝叶斯先验(即,添加关于信封中货币的初始分配的信念),则可以根据给定的先前信念来求解的最优值。d
  • 在某些情况下(例如,您观察得越多,获得大信封的可能性就越大),截止策略甚至是最佳的。
  • 在更一般的贝叶斯设置中,对于许多先验,您可以比简单的截止策略做得更好。

一个相关但不同的问题:

正如几个@Glen_b和@whuber所提到的,有一个相关的难题称为“ 两个信封问题”,其中给出了一个谬误的论点,该论点总是切换信封,并且可以通过采用贝叶斯方法并在该问题上添加先验信念来看出该论点中的缺陷。两个信封的内容。

从某种意义上说,这里描述的难题是完全不同的。Wapner的说法是正确的!


1
好,现在我看到了矛盾的根源。或者,具体来说,是其他信息流入系统的位置。通过有意识地选择d的分布,我们利用我们的先验知识来了解两个信封中的货币数量或多或少应该在哪里。在最坏的情况下,我们的知识是无用的,但是该方法保证了使用它不会对我们不利。
1

经过一番思考,我还是不明白-见编辑
1

方案(A)假设小信封有,大信封有。让我们选择 =15。P。决策规则将在100%的时间内引导您做出正确的选择!1020dP(x<d)=P(x>d)
马修·冈恩

现在让我们研究一些方案(B)。想象一下,小信封的奇数美元数为1到9(例如1或3或5或7或9),大信封的奇数美元数为1。选择,然后选择。但是,如果您拒绝决策规则,则没有帮助!如果或,则导致正确的决策;如果则导致错误的决策。回想一下可能的对是(1,2),(3、4),(5、6),(7、8)(9、10)$如果您看到一个零钱。P X < d = P X > d < 5.5 X = 1 3 5 6 8 10 X = 2 4 7 9d=5.5P(x<d)=P(x>d)<5.5x=1,3,5,6,8,10x=2,4,7,9
马修·冈恩

我们不知道和的分布,因此我们无法按照您提出的方式进行选择。打开信封后,我们知道,但我们不知道它是从1到9的整数中随机选择的,因此我们不能选择为5.5。如上文@Glen_b所述,必须从非负连续分布中选择。y x d dxyxdd
1

0

我对此很感兴趣,并采取了在Excel中使用它的务实方法。

我为x,y和d生成了三个随机数,范围为1-100。然后,我在d与x之间以及x与y之间进行了比较,并查看了对与错的结果。

我做了500次,并重复了几次,并如预期的那样,在500个问题中,经常得到330个正确的答案。

然后,我将d的范围增加到1-10000,对于500次运行,正确答案降至约260。

因此,是的,d的选择取决于x和y的期望值。

鲍勃


0

我认为方程式p +(1-p)/ 2的Wapner展开的明显悖论是假定(1-p)/ 2> 0。对于d的许多范围,该值为0。

例如:从以开放包络中的值为中心的对称分布中选择的任何d,都将给出错误1/2和正确1/2的概率。

任何不对称选择的分布似乎都会以错误的方式将选择偏差1/2倍。

那么有没有办法为d选择一个范围和分布,使该方程成立?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.