信封悖论

8

有两个信封。一个包含货币，另一个包含货币数量。我不知道确切的数量“ ”，但我知道上面的内容。我选择一个信封，然后打开它。我看到其中有钱，显然。 $x$ $2x$ $x$ $y$ $y \in \{x, 2x\}$

现在，我可以保留或更换信封。

切换的期望值为。保留我的信封的期望值为。 $(\frac{1}{2} \cdot 2y + \frac{1}{2} \cdot \frac{1}{2}y) = \frac{5}{4}y$ $y$

看来我应该经常换信封。我的两个问题：

这个推理正确吗？

如果不允许我打开信封并看到金额，然后可以选择无限期切换，是否有什么不同？ $y$

microeconomics expected-utility

— Kitsune骑兵
source

2

相关：en.wikipedia.org/wiki/Two_envelopes_problem

— Herr K.

1

您不能只接受期望，您应该从关于x的信念开始，然后根据贝叶斯规则更新您的信念。一旦看到y，您对打开哪个信封的信念就会改变。

— HRSE

假设x均匀地分布在0和之间。那呢

\infty

$\infty$

— Kitsune Cavalry

@KitsuneCavalry没有这种分配。（请给我发送一个生成这种分布的程序。）实际上，没有解决方法可以针对所有值生成问题中给出的虚假信念。在Herr K.的链接中，en.wikipedia.org

y

$y$

— wiki /…中

3

@Kitsune骑兵在贝叶斯统计中，半线（或整条线）的均匀分布是众所周知的不当先验，请参阅stats.stackexchange.com/a/97790/28746或 stats.stackexchange.com/a/ 35794/28746

— Alecos Papadopoulos

Answers:

5

这是解决问题的“预期效用最大化/博弈论”方法（带有一定的理论集概率）。在这样的框架中，答案似乎很明确。

处所

绝对诚实地告诉我们，对于个严格正数的货币，会将以下两张票证放置在一个框中：并分配了标识号并且并分配了标识号。然后执行伯努利随机变量的平局，并基于结果和发生的事件，将数量和放入信封和。我们没有被告知的值是多少，或者哪个值到达哪个包络。 $x$ $\{A=x, B= 2x\}$ $1$ $\{A=2x, B= x\}$ $0$ $(p=0.5)$ $x$ $2x$ $A$ $B$ $x$

第一种情况：选择一个信封，并选择不打开就进行切换

第一个问题是我们如何选择信封？这与首选项有关。因此，假设我们是期望的效用最大化器，具有效用函数。 $u()$

我们可以在这里通过考虑两个二分随机变量（表示包络的和以及其中的数量）来对概率结构建模。每个的支持是。但是他们不是独立的。因此，我们必须从联合分配开始。在表格形式中，联合分布以及相应的边际分布为 $A$ $B$ $\{x, 2x\}$

\begin{array}{rr} A / B \to & x & 2 x & Marg A \\ x & 0 & 0.5 & 0.5 \\ 2 x & 0.5 & 0 & 0.5 \\ Marg B & 0.5 & 0.5 & 1.00 \end{array}

$\begin{array}{| r | r | } \hline \text{A} \;/ \;\;\text{B} \rightarrow & x & 2x & \text {Marg A} \\ \hline \hline x & 0 & 0.5 & 0.5\\ \hline 2x & 0.5 & 0 & 0.5 \\ \hline \text{Marg B} & 0.5 & 0.5 & 1.00 \\ \hline \end{array}$

这告诉我们和具有相同的边际分布。 $A$ $B$

但这意味着选择信封并不重要，因为我们将始终获得相同的预期效用，

0.5 \cdot u (x) + 0.5 \cdot u (2 x)

$0.5 \cdot u(x) + 0.5\cdot u(2x)$

我们在这里面对的是在两个相同的赌博（每个信封）上的复合赌博（如何选择信封）。我们可以选择具有概率，，或任何在两者之间（和互补的）。没关系我们将始终获得相同的预期效用。请注意，我们对风险的态度在这里不起作用。 $A$ $1$ $0$ $B$

因此，我们确实选择了一个信封，说，我们正在研究它。现在我们期望的效用是什么？与选择之前完全一样。以任何方式挑选信封不会影响内部物品的可能性。 $A$

我们可以切换。说我们做的，现在我们都拿着信封。现在预期有什么效用？与以前完全一样。 $B$

这是世界对我们的两个可能的状态：选择或选择。在任何选择下，世界两个州对我们选择/假定的驱动力都具有相同的值（即，最大化预期效用）。 $A$ $B$

因此，在这里，我们对切换无动于衷。，实际上我们也可以将其随机化。

第二种情况：打开信封，然后选择

现在假设我们选择，将其打开，然后在找到。这会改变事情吗？ $A$ $y \in \{x, 2x\}$

让我们来看看。我想知道是什么

P (A = x ∣ A \in {x, 2 x}) = ?

$P(A = x \mid A \in \{x, 2x\}) = ?$

好吧，是在其上定义随机变量的样本空间。以整个样本空间为条件，即以琐碎的sigma-代数为条件，既不影响概率，也不影响预期值。好像我们想知道“ 如果我们知道所有可能的值都已经实现，那么值是多少？” 没有获得有效的知识，因此我们仍处于原始的概率结构。 $\{x, 2x\}$ $A$ $A$

但我也想知道，什么是

P (B = x ∣ A \in {x, 2 x}) = ?

$P(B = x \mid A \in \{x, 2x\}) = ?$

条件语句正确地视为由事件生成的sigma代数，是整个产品样本空间，随机向量已经定义。从上面的联合分布表中，我们可以看到联合的概率分配与边际的概率分配等效（由于存在两个零度量事件，因此“几乎可以肯定”的资格）。因此，在这里我们也从根本上限制了在整个样本空间上的概率。因此，我们打开信封的动作也不会影响的概率结构。 $\big \{A \in \{x, 2x\}\big\}$ $(A,B)$ $B$ $B$

输入博弈论和决策。我们已经打开信封，我们必须决定是否要切换。如果不进行切换，则会得到效用。如果我们切换，那么我们处于以下两种可能的状态 $u(y)$

y = x, u (A) = u (x) ⟹ u (B) = u (2 x)

$y = x, u(A) = u(x) \implies u(B) = u(2x)$

y = 2 x, u (A) = u (2 x) ⟹ u (B) = u (x)

$y = 2x, u(A) = u(2x)\implies u(B) = u(x)$

我们不知道哪个状态实际成立，但是根据以上讨论，我们知道每个状态都有存在的概率。 $p=0.5$

我们可以将此模型建模为对手是“自然”的游戏，并且我们知道自然可以肯定地玩一个随机策略：且，。但是我们现在也知道，如果不进行转换，我们的收益是肯定的。所以这是我们正常情况下的游戏，并获得收益： $p=0.5$ $y=x$ $p=0.5$ $y=2x$

\begin{array}{rr} We / nature \to & y = x & y = 2 x \\ Switch & u (2 x) & u (x) \\ Don't Switch & u (y) & u (y) \end{array}

$\begin{array}{| r | r | } \hline \text{We} \;/ \;\;\text{nature} \rightarrow &y= x & y=2x \\ \hline \text{Switch} & u(2x) & u(x) \\ \hline \text{Don't Switch} & u(y) & u(y) \\ \hline \end{array}$

我们应该抵制用和代替的诱惑。是已知的和一定的收益。实际上不知道“切换”策略的收益（因为我们不知道的值）。因此，我们应该反转替换。如果则，如果则。所以这又是我们的游戏： $u(x)$ $u(2x)$ $u(y)$ $u(y)$ $x$ $y=x$ $u(2x) = u(2y)$ $y=2x$ $u(x) = u(y/2)$

\begin{array}{rr} We / nature \to & y = x & y = 2 x \\ Switch & u (2 y) & u (y / 2) \\ Don't Switch & u (y) & u (y) \end{array}

$\begin{array}{| r | r | } \hline \text{We} \;/ \;\;\text{nature} \rightarrow &y= x & y=2x \\ \hline \text{Switch} & u(2y) & u(y/2) \\ \hline \text{Don't Switch} & u(y) & u(y) \\ \hline \end{array}$

现在，矩阵中的所有收益都是已知的。是否有纯粹的主导策略？

策略“ Switch”的预期收益为

E (V_{S}) = 0.5 \cdot u (2 y) + 0.5 \cdot u (y / 2)

$E(V_S) = 0.5\cdot u(2y) + 0.5 \cdot u(y/2)$

策略“不要切换”的预期收益为

E (V_{D S}) = u (y)

$E(V_{DS}) = u(y)$

如果我们应该切换

E (V_{S}) > E (V_{D S}) ⟹ 0.5 \cdot u (2 y) + 0.5 \cdot u (y / 2) > u (y)

$E(V_S) > E(V_{DS}) \implies 0.5\cdot u(2y) + 0.5 \cdot u(y/2) > u(y)$

而现在，对风险的态度变得至关重要。不难推断，在冒险和风险中性行为下，我们应该改行。

关于规避风险的行为，我发现一个不错的结果：

对于“凹度较小”（严格以上）的效用函数，而不是对数（例如平方根），则仍应切换。

对于对数效用，我们对是否切换无关紧要。 $u(y) = \ln y$

对于“下凹”比（严格小于）对数效用函数，我们应该不切换。

用对数情况的图结束

假设。然后。线是“ Switch”的期望效用所在的线。由于自然界采取策略，因此实际上将在点，即中点。到那时，使用对数实用程序，我们从“请勿切换”中获得了完全相同的实用程序，即对于此数值示例，。 $y=4$ $y/2 =2, 2y = 8$ $Γ-Δ-Ε$ $50-50$ $\Delta$ $Γ-Δ-Ε$ $\ln(4)$

— 阿莱科斯·帕帕多普洛斯
source

通过对数效用函数调用“风险规避”并不能解决这一矛盾。正如@HRSE所指出的，使用贝叶斯定理，概率，所述收益是和是不是 0.5后，看不到在第一包络的量。这将仅保持一个高度可疑均匀不当上之前（为），如果使用在一个适当的现有（反映约一的信念），溶液变成切换如果足够小，并保持第一包络如果是足够大的。参见jstor.org/稳定/ 2685310。

u (2 y)

$u(2y)$

u (y / 2

$u(y/2$

x

$x$

x > 0

$x>0$

x

$x$

x

$x$

y

$y$

y

$y$

— Jarle Tufto

@JarleTufto在我看来，统一的先验是正确的先验，如果人们决定相信游戏的组织者，当他们说钱是在伯努利抽签后以投入信封时，则是正确的。如果您想变得可疑，不相信组织者并形成其他先验信念，那当然是他的权利，但是他将不得不提出一些论点以说服我a）组织者为何撒谎，b）如何他选择了不同的先验吗？请注意，我的回答前提是我们相信此事件的组织者。

p = 0.5

$p=0.5$

— Alecos Papadopoulos

我当然同意给您每个信封，分别包含数量和且概率分别为1/2。我的意思是，对于所有，您使用的上隐含的不正确先验先验导致自相矛盾，因为贝叶斯定理随后导致，其中是第一个包络线中的观测值。相反，使用适当的先验，这些条件概率会有所不同，并且最佳决策取决于（当然还有效用函数）。

X

$X$

2 X

$2X$

X

$X$

π (x) = 1

$\pi(x) =1$

x > 0

$x>0$

P (X = y | Y = y) = P (X = y / 2 | Y = y) = 1 / 2

$P(X=y|Y=y) = P(X=y/2|Y=y)=1/2$

y

$y$

π (x)

$\pi(x)$

y

$y$

— Jarle Tufto

@JarleTufto您之前提到的这个不当之处，反映出与什么相关的概率？

— Alecos Papadopoulos

两个信封中的金额分别为和。先验概率分布表示您打开任何信封之前对的信念。您要么隐式地使用了这个特定的先验，要么犯了等同于反向条件概率的谬论。

X

$X$

2 X

$2X$

X

$X$

— Jarle Tufto

0

如果打开信封E1并看到其值为E1 = Y，则其他信封E2的值确实在{E2 = Y / 2，E2 = 2Y}中。

确实，该包络线的期望值为（Y / 2）* Pr（E2 = Y / 2）+（2Y）* Pr（E2 = 2Y）。

错误是假设不管Y是什么，Pr（E2 = Y / 2）= Pr（E2 = 2Y）= 1/2。一种简单的表示方法是，假设每个信封中都装有各种面额的美国纸币。如果Y = $ 1，则这是不可能的E2为Y / 2。

这里没有一个更严格的证明可提供，但是其总结是首先假设，对于任何值Z，Pr（Z / 2 <= E2 <Z）= Pr（Z <= E2 <2Z）。这基本上与上一段相同，但扩展到一系列值。但是，如果这是对任何值真Ž，则意味着PR（Z * 2 ^（N-1）<= E2 <Z * 2 ^（N-1））是用于的每个值恒定Ñ，从-INF到信息由于这是不可能的，因此该假设是不正确的。

+++++

这可能有点令人困惑，所以让我尝试一个例子。您将获得两套两个信封。在一组中，它们包含10和20美元。在另一组中，它们包含20和40。您选择一个组，然后打开该组中的一个信封以找到20。然后，您就有机会切换到该组中的另一个信封。你应该？

是的，应该切换。切换到另一个包络的预期增益为[（20-10）+（20-40）] / 2 = +5。

请注意，此实例 -也就是说，知道您找到20，而不是10或40，就符合您在问题中描述的条件。因此您的解决方案有效。但是实验本身不符合该描述。如果您找到了10，或者您找到了40，则另一个信封有20的概率为100％。预期收益分别为+10和-20。如果将三个可能的收益平均化为概率，则将得到三个值，则得到10/4 + 5/2-20/4 = 0。

— 杰夫·乔
source

我为什么要假设一个信封里没有50美分？另外，问题特别是询问您可能不知道其中可能存在的金额，只是可能的相对金额的时间，因此我并不是很在意。

— Kitsune Cavalry

我说这是一种简单的方法。它始于“假设每个信封中都装有美国纸币”。由于您的美国纸币不能有50美分，因此Pr（E2 = 1）= 1。关键是，当您不知道Y时，假设Y / 2和2Y的可能性相同，那么就假设Y的事实分布是不可能实现的。

2 | E 1 =

$2|E1=$

— JeffJo，2016年

0

通常，该问题无法解决，因为您尚未指定整个实验的随机过程。

但是，让Y为您选择的信封的值，让X为其他信封。答案是 -这是一个有条件的期望。然而，假设y的最一般的分布，Y被均匀地从所有的绘制。但是然后，并且通过Borel–Kolmogorov悖论，期望是无法解决的。 $E[X|Y=y]$ $\mathbb{R}$ $Pr(Y=y)=0$

— 约翰·兰博
source

@JeffJo，由于没有足够的声誉，我无法在您的帖子下发表评论。我添加了此答案，因为我认为它与您的帖子有关。

— John Rambo

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.

Licensed under cc by-sa 3.0 with attribution required.