信封悖论


8

有两个信封。一个包含货币,另一个包含货币数量。我不知道确切的数量“ ”,但我知道上面的内容。我选择一个信封,然后打开它。我看到其中有钱,显然。x2xxyy{x,2x}

现在,我可以保留或更换信封。

切换的期望值为。保留我的信封的期望值为。(122y+1212y)=54yy

看来我应该经常换信封。我的两个问题:

这个推理正确吗?

如果不允许我打开信封并看到金额,然后可以选择无限期切换,是否有什么不同?y



1
您不能只接受期望,您应该从关于x的信念开始,然后根据贝叶斯规则更新您的信念。一旦看到y,您对打开哪个信封的信念就会改变。
HRSE

假设x均匀地分布在0和之间。那呢
Kitsune Cavalry

@KitsuneCavalry没有这种分配。(请给我发送一个生成这种分布的程序。)实际上,没有解决方法可以针对所有值生成问题中给出的虚假信念。在Herr K.的链接中,en.wikipedia.orgy
wiki /…中

3
@Kitsune骑兵在贝叶斯统计中,半线(或整条线)的均匀分布是众所周知的不当先验,请参阅stats.stackexchange.com/a/97790/28746stats.stackexchange.com/a/ 35794/28746
Alecos Papadopoulos

Answers:


5

这是解决问题的“预期效用最大化/博弈论”方法(带有一定的理论集概率)。在这样的框架中,答案似乎很明确。

处所

绝对诚实地告诉我们,对于个严格正数的货币,会将以下两张票证放置在一个框中: 并分配了标识号并且并分配了标识号。然后执行伯努利随机变量的平局 ,并基于结果和发生的事件,将数量和放入信封和。我们没有被告知的值是多少,或者哪个值到达哪个包络。x{A=x,B=2x}1{A=2x,B=x}0(p=0.5)x2xABx

第一种情况:选择一个信封,并选择不打开就进行切换

第一个问题是我们如何选择信封?这与首选项有关。因此,假设我们是期望的效用最大化器,具有效用函数。u()

我们可以在这里通过考虑两个二分随机变量(表示包络的和以及其中的数量)来对概率结构建模。每个的支持是。但是他们不是独立的。因此,我们必须从联合分配开始。在表格形式中,联合分布以及相应的边际分布为AB{x,2x}

A/Bx2xMarg Ax00.50.52x0.500.5Marg B0.50.51.00

这告诉我们和具有相同的边际分布。AB

但这意味着选择信封并不重要,因为我们将始终获得相同的预期效用

0.5u(x)+0.5u(2x)

我们在这里面对的是在两个相同的赌博(每个信封)上的复合赌博(如何选择信封)。我们可以选择具有概率,,或任何在两者之间(和互补的)。没关系 我们将始终获得相同的预期效用。请注意,我们对风险的态度在这里不起作用。A10B

因此,我们确实选择了一个信封,说,我们正在研究它。现在我们期望的效用是什么?与选择之前完全一样。以任何方式挑选信封不会影响内部物品的可能性。A

我们可以切换。说我们做的,现在我们都拿着信封。现在预期有什么效用?与以前完全一样B

这是世界对我们的两个可能的状态:选择或选择。在任何选择下,世界两个州对我们选择/假定的驱动力都具有相同的值(即,最大化预期效用)。AB

因此,在这里,我们对切换无动于衷。,实际上我们也可以将其随机化。

第二种情况:打开信封,然后选择

现在假设我们选择,将其打开,然后在找到。这会改变事情吗? Ay{x,2x}

让我们来看看。我想知道是什么

P(A=xA{x,2x})=?

好吧,是在其上定义随机变量的样本空间。以整个样本空间为条件,即以琐碎的sigma-代数为条件,既不影响概率,也不影响预期值。好像我们想知道“ 如果我们知道所有可能的值都已经实现,那么值是多少?” 没有获得有效的知识,因此我们仍处于原始的概率结构。 {x,2x}AA

但我也想知道,什么是

P(B=xA{x,2x})=?

条件语句正确地视为由事件生成的sigma代数,是整个产品样本空间,随机向量已经定义。从上面的联合分布表中,我们可以看到联合的概率分配与边际的概率分配等效(由于存在两个零度量事件,因此“几乎可以肯定”的资格)。因此,在这里我们也从根本上限制了在整个样本空间上的概率。因此,我们打开信封的动作也不会影响的概率结构。{A{x,2x}}(A,B)BB

输入博弈论和决策。我们已经打开信封,我们必须决定是否要切换。如果不进行切换,则会得到效用。如果我们切换,那么我们处于以下两种可能的状态u(y)

y=x,u(A)=u(x)u(B)=u(2x)
y=2x,u(A)=u(2x)u(B)=u(x)

我们不知道哪个状态实际成立,但是根据以上讨论,我们知道每个状态都有存在的概率。 p=0.5

我们可以将此模型建模为对手是“自然”的游戏,并且我们知道自然可以肯定地玩一个随机策略:且,。但是我们现在也知道,如果不进行转换,我们的收益是肯定的。所以这是我们正常情况下的游戏,并获得收益:p=0.5 y=xp=0.5y=2x

We/naturey=xy=2xSwitchu(2x)u(x)Don't Switchu(y)u(y)

我们应该抵制用和代替的诱惑。是已知的和一定的收益。实际上不知道“切换”策略的收益(因为我们不知道的值)。因此,我们应该反转替换。如果则,如果则。所以这又是我们的游戏:u(x)u(2x)u(y)u(y)xy=xu(2x)=u(2y)y=2xu(x)=u(y/2)

We/naturey=xy=2xSwitchu(2y)u(y/2)Don't Switchu(y)u(y)

现在,矩阵中的所有收益都是已知的。是否有纯粹的主导策略?

策略“ Switch”的预期收益为

E(VS)=0.5u(2y)+0.5u(y/2)

策略“不要切换”的预期收益为

E(VDS)=u(y)

如果我们应该切换

E(VS)>E(VDS)0.5u(2y)+0.5u(y/2)>u(y)

现在,对风险的态度变得至关重要。不难推断,在冒险和风险中性行为下,我们应该改行。

关于规避风险的行为,我发现一个不错的结果:

对于“凹度较小”(严格以上)的效用函数,而不是对数(例如平方根),则仍应切换。

对于对数效用,我们对是否切换无关紧要。u(y)=lny

对于“下凹”比(严格小于)对数效用函数,我们应该切换。

用对数情况的图结束

在此处输入图片说明

假设。然后。线是“ Switch”的期望效用所在的线。由于自然界采取策略,因此实际上将在点,即中点。到那时,使用对数实用程序,我们从“请勿切换”中获得了完全相同的实用程序,即对于此数值示例,。y=4y/2=2,2y=8ΓΔΕ5050ΔΓΔΕln(4)


通过对数效用函数调用“风险规避”并不能解决这一矛盾。正如@HRSE所指出的,使用贝叶斯定理,概率,所述收益是和是不是 0.5后,看不到在第一包络的量。这将仅保持一个高度可疑均匀不当上之前(为),如果使用在一个适当的现有(反映约一的信念),溶液变成切换如果足够小,并保持第一包络如果是足够大的。参见jstor.org/稳定/ 2685310u(2y)u(y/2xx>0xxyy
Jarle Tufto

@JarleTufto在我看来,统一的先验是正确的先验,如果人们决定相信游戏的组织者,当他们说钱是在伯努利抽签后以投入信封时,则是正确的。如果您想变得可疑,不相信组织者并形成其他先验信念,那当然是他的权利,但是他将不得不提出一些论点以说服我a)组织者为何撒谎,b)如何他选择了不同的先验吗?请注意,我的回答前提是我们相信此事件的组织者。p=0.5
Alecos Papadopoulos

我当然同意给您每个信封,分别包含数量和且概率分别为1/2。我的意思是,对于所有,您使用的上隐含的不正确先验先验导致自相矛盾,因为贝叶斯定理随后导致,其中是第一个包络线中的观测值。相反,使用适当的先验,这些条件概率会有所不同,并且最佳决策取决于(当然还有效用函数)。X2XXπ(x)=1x>0P(X=y|Y=y)=P(X=y/2|Y=y)=1/2yπ(x)y
Jarle Tufto

@JarleTufto您之前提到的这个不当之处,反映出与什么相关的概率?
Alecos Papadopoulos

两个信封中的金额分别为和。先验概率分布表示您打开任何信封之前对的信念。您要么隐式地使用了这个特定的先验,要么犯了等同于反向条件概率的谬论。X2XX
Jarle Tufto

0

如果打开信封E1并看到其值为E1 = Y,则其他信封E2的值确实在{E2 = Y / 2,E2 = 2Y}中

确实,该包络线的期望值为(Y / 2)* Pr(E2 = Y / 2)+(2Y)* Pr(E2 = 2Y)

错误是假设不管Y是什么,Pr(E2 = Y / 2)= Pr(E2 = 2Y)= 1/2。一种简单的表示方法是,假设每个信封中都装有各种面额的美国纸币。如果Y = $ 1,则这是不可能的E2Y / 2

这里没有一个更严格的证明可提供,但是其总结是首先假设,对于任何值ZPr(Z / 2 <= E2 <Z)= Pr(Z <= E2 <2Z)。这基本上与上一段相同,但扩展到一系列值。但是,如果这是对任何值真Ž,则意味着PR(Z * 2 ^(N-1)<= E2 <Z * 2 ^(N-1))是用于的每个值恒定Ñ,从-INF到信息 由于这是不可能的,因此该假设是不正确的。

+++++

这可能有点令人困惑,所以让我尝试一个例子。您将获得两套两个信封。在一组中,它们包含10和20美元。在另一组中,它们包含20和40。您选择一个组,然后打开该组中的一个信封以找到20。然后,您就有机会切换到该组中的另一个信封。你应该?

是的,应该切换。切换到另一个包络的​​预期增益为[(20-10)+(20-40)] / 2 = +5。

请注意,此实例 -也就是说,知道您找到20,而不是10或40,就符合您在问题中描述的条件。因此您的解决方案有效。但是实验本身不符合该描述。如果您找到了10,或者您找到了40,则另一个信封有20的概率为100%。预期收益分别为+10和-20。如果将三个可能的收益平均化为概率,则将得到三个值,则得到10/4 + 5/2-20/4 = 0。


我为什么要假设一个信封里没有50美分?另外,问题特别是询问您可能不知道其中可能存在的金额,只是可能的相对金额的时间,因此我并不是很在意。
Kitsune Cavalry

我说这是一种简单的方法。它始于“假设每个信封中都装有美国纸币”。由于您的美国纸币不能有50美分,因此Pr(E2 = 1)= 1。关键是,当您不知道Y时,假设Y / 2和2Y的可能性相同,那么就假设Y的事实分布是不可能实现的。2|E1=
JeffJo,2016年

0

通常,该问题无法解决,因为您尚未指定整个实验的随机过程。

但是,让Y为您选择的信封的值,让X为其他信封。答案是 -这是一个有条件的期望。然而,假设y的最一般的分布,Y被均匀地从所有的绘制。但是然后,并且通过Borel–Kolmogorov悖论,期望是无法解决的。E[X|Y=y]RPr(Y=y)=0


@JeffJo,由于没有足够的声誉,我无法在您的帖子下发表评论。我添加了此答案,因为我认为它与您的帖子有关。
John Rambo
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.