有两个信封。一个包含货币,另一个包含货币数量。我不知道确切的数量“ ”,但我知道上面的内容。我选择一个信封,然后打开它。我看到其中有钱,显然。
现在,我可以保留或更换信封。
切换的期望值为。保留我的信封的期望值为。
看来我应该经常换信封。我的两个问题:
这个推理正确吗?
如果不允许我打开信封并看到金额,然后可以选择无限期切换,是否有什么不同?
有两个信封。一个包含货币,另一个包含货币数量。我不知道确切的数量“ ”,但我知道上面的内容。我选择一个信封,然后打开它。我看到其中有钱,显然。
现在,我可以保留或更换信封。
切换的期望值为。保留我的信封的期望值为。
看来我应该经常换信封。我的两个问题:
这个推理正确吗?
如果不允许我打开信封并看到金额,然后可以选择无限期切换,是否有什么不同?
Answers:
这是解决问题的“预期效用最大化/博弈论”方法(带有一定的理论集概率)。在这样的框架中,答案似乎很明确。
处所
绝对诚实地告诉我们,对于个严格正数的货币,会将以下两张票证放置在一个框中: 并分配了标识号并且并分配了标识号。然后执行伯努利随机变量的平局 ,并基于结果和发生的事件,将数量和放入信封和。我们没有被告知的值是多少,或者哪个值到达哪个包络。
第一种情况:选择一个信封,并选择不打开就进行切换
第一个问题是我们如何选择信封?这与首选项有关。因此,假设我们是期望的效用最大化器,具有效用函数。
我们可以在这里通过考虑两个二分随机变量(表示包络的和以及其中的数量)来对概率结构建模。每个的支持是。但是他们不是独立的。因此,我们必须从联合分配开始。在表格形式中,联合分布以及相应的边际分布为
这告诉我们和具有相同的边际分布。
但这意味着选择信封并不重要,因为我们将始终获得相同的预期效用,
我们在这里面对的是在两个相同的赌博(每个信封)上的复合赌博(如何选择信封)。我们可以选择具有概率,,或任何在两者之间(和互补的)。没关系 我们将始终获得相同的预期效用。请注意,我们对风险的态度在这里不起作用。
因此,我们确实选择了一个信封,说,我们正在研究它。现在我们期望的效用是什么?与选择之前完全一样。以任何方式挑选信封不会影响内部物品的可能性。
我们可以切换。说我们做的,现在我们都拿着信封。现在预期有什么效用?与以前完全一样。
这是世界对我们的两个可能的状态:选择或选择。在任何选择下,世界两个州对我们选择/假定的驱动力都具有相同的值(即,最大化预期效用)。
因此,在这里,我们对切换无动于衷。,实际上我们也可以将其随机化。
第二种情况:打开信封,然后选择
现在假设我们选择,将其打开,然后在找到。这会改变事情吗?
让我们来看看。我想知道是什么
好吧,是在其上定义随机变量的样本空间。以整个样本空间为条件,即以琐碎的sigma-代数为条件,既不影响概率,也不影响预期值。好像我们想知道“ 如果我们知道所有可能的值都已经实现,那么值是多少?” 没有获得有效的知识,因此我们仍处于原始的概率结构。
但我也想知道,什么是
条件语句正确地视为由事件生成的sigma代数,是整个产品样本空间,随机向量已经定义。从上面的联合分布表中,我们可以看到联合的概率分配与边际的概率分配等效(由于存在两个零度量事件,因此“几乎可以肯定”的资格)。因此,在这里我们也从根本上限制了在整个样本空间上的概率。因此,我们打开信封的动作也不会影响的概率结构。
输入博弈论和决策。我们已经打开信封,我们必须决定是否要切换。如果不进行切换,则会得到效用。如果我们切换,那么我们处于以下两种可能的状态
我们不知道哪个状态实际成立,但是根据以上讨论,我们知道每个状态都有存在的概率。
我们可以将此模型建模为对手是“自然”的游戏,并且我们知道自然可以肯定地玩一个随机策略:且,。但是我们现在也知道,如果不进行转换,我们的收益是肯定的。所以这是我们正常情况下的游戏,并获得收益:
我们应该抵制用和代替的诱惑。是已知的和一定的收益。实际上不知道“切换”策略的收益(因为我们不知道的值)。因此,我们应该反转替换。如果则,如果则。所以这又是我们的游戏:
现在,矩阵中的所有收益都是已知的。是否有纯粹的主导策略?
策略“ Switch”的预期收益为
策略“不要切换”的预期收益为
如果我们应该切换
而现在,对风险的态度变得至关重要。不难推断,在冒险和风险中性行为下,我们应该改行。
关于规避风险的行为,我发现一个不错的结果:
对于“凹度较小”(严格以上)的效用函数,而不是对数(例如平方根),则仍应切换。
对于对数效用,我们对是否切换无关紧要。
对于“下凹”比(严格小于)对数效用函数,我们应该不切换。
用对数情况的图结束
假设。然后。线是“ Switch”的期望效用所在的线。由于自然界采取策略,因此实际上将在点,即中点。到那时,使用对数实用程序,我们从“请勿切换”中获得了完全相同的实用程序,即对于此数值示例,。
如果打开信封E1并看到其值为E1 = Y,则其他信封E2的值确实在{E2 = Y / 2,E2 = 2Y}中。
确实,该包络线的期望值为(Y / 2)* Pr(E2 = Y / 2)+(2Y)* Pr(E2 = 2Y)。
错误是假设不管Y是什么,Pr(E2 = Y / 2)= Pr(E2 = 2Y)= 1/2。一种简单的表示方法是,假设每个信封中都装有各种面额的美国纸币。如果Y = $ 1,则这是不可能的E2为Y / 2。
这里没有一个更严格的证明可提供,但是其总结是首先假设,对于任何值Z,Pr(Z / 2 <= E2 <Z)= Pr(Z <= E2 <2Z)。这基本上与上一段相同,但扩展到一系列值。但是,如果这是对任何值真Ž,则意味着PR(Z * 2 ^(N-1)<= E2 <Z * 2 ^(N-1))是用于的每个值恒定Ñ,从-INF到信息 由于这是不可能的,因此该假设是不正确的。
+++++
这可能有点令人困惑,所以让我尝试一个例子。您将获得两套两个信封。在一组中,它们包含10和20美元。在另一组中,它们包含20和40。您选择一个组,然后打开该组中的一个信封以找到20。然后,您就有机会切换到该组中的另一个信封。你应该?
是的,应该切换。切换到另一个包络的预期增益为[(20-10)+(20-40)] / 2 = +5。
请注意,此实例 -也就是说,知道您找到20,而不是10或40,就符合您在问题中描述的条件。因此您的解决方案有效。但是实验本身不符合该描述。如果您找到了10,或者您找到了40,则另一个信封有20的概率为100%。预期收益分别为+10和-20。如果将三个可能的收益平均化为概率,则将得到三个值,则得到10/4 + 5/2-20/4 = 0。
通常,该问题无法解决,因为您尚未指定整个实验的随机过程。
但是,让Y为您选择的信封的值,让X为其他信封。答案是 -这是一个有条件的期望。然而,假设y的最一般的分布,Y被均匀地从所有的绘制。但是然后,并且通过Borel–Kolmogorov悖论,期望是无法解决的。