为了最大程度地正确猜测抛硬币的结果,我是否应该始终选择最可能的结果?


20

这不是功课。我有兴趣了解我的逻辑是否适合此简单的统计问题。

假设我有一个2面硬币,翻转头部的概率为,翻转末端的概率为。假设所有翻转都有独立的概率。现在,假设我想最大程度地预测下一次翻转时硬币是正面还是反面的机会。如果,则我可以随机猜测正面或反面,而我正确的可能性为。P(H)P H = 0.5 0.51P(H)P(H)=0.50.5

现在,假设,如果我想最大化我正确猜测的机会,我是否应该总是猜测概率为尾巴?0.8P(H)=0.20.8

如果我有一个3面模具,并且将1、2或3滚动的概率为,和,则进一步采取这一步骤,我是否应该总是猜2以最大程度地提高正确猜的机会?还有另一种方法可以让我更准确地猜测吗?P 2 = 0.5 P 3 = 0.4P(1)=0.1P(2)=0.5P(3)=0.4


4
在我看来,您在询问独立性:例如,如果您一次获得头脑,这是否会使下一次出现“尾巴”的可能性更大?如果这不是您要的内容,您能否澄清您的问题?(如果我正确理解了您的问题,答案是“是”:在

感谢@arboviral的帮助。是的,我假设自己是独立的。我已经更新了问题以表明这一点。
乌龟

4
假设独立是您最好的选择,那就是选择概率最高的一方。这样想吧。您没有其他信息可以做出更好的猜测。您只知道骰子多久出现一次以及最后几对掷出什么。但是独立性告诉您,前几行对当前抛出没有影响。也许您有更多信息,例如用来掷骰子的力量,左手/右手投掷器或掷骰前的摇动次数。但是,如果骰子真的很公平,我怀疑即使是详细程度也会提供更好的预测。
布伦特·费里尔

您的猜测是正确的;这是Holder不等式(带有参数)的直接结果。(1,)
ub

您知道P(H)= 0.2吗?还是您必须通过观察结果来解决?
Akavall '16

Answers:


43

你是对的。如果,并且您使用的是零损失(也就是说,您需要猜测实际结果而不是概率或其他东西,此外,当您猜到尾巴时获得正面收益与当您猜到头时会碰到尾巴),您应该每次都猜到尾巴。P(H)=0.2

人们通常会错误地认为答案是猜测随机选择的80%试验中的尾巴,而其余试验中的头正。这种策略称为“ 概率匹配 ”,并且已经在行为决策中进行了广泛的研究。例如,参见

West,RF,和Stanovich,KE(2003)。概率匹配明智吗?概率选择与认知能力之间的关联。记忆与认知,31,243–251。doi:10.3758 / BF03194383


1
+1为指向概率匹配的指针。以前从未听说过,尽管我确定我每天都会利用它作为认知偏见!:)
leekaiinthesky

2
(+1)这与解释多项式回归模型等时的常见误解有关:人们可能会惊讶地发现预测类的分布与观察到的类的分布不匹配,甚至为“修复”它的方法而苦恼。(很高兴知道它的名字。)
Scortchi-恢复莫妮卡

1
(+1)表示“概率匹配”。
海涛杜

13

您实质上是在问一个非常有趣的问题:我应该使用“ MAP贝叶斯”预测最大后验估计还是“真实贝叶斯”进行预测

假设您知道的真实分布,然后使用MAP估计,假设您要对下100个翻转结果进行100个预测。您应该总是猜想翻转是尾巴,而不是猜测头和尾巴。这就是所谓的“ MAP贝叶斯”,基本上你在做20 80P(H)=0.22080

argmaxθf(x|θ)

不难证明,这样做可以最大程度地减少预测误差(0-1损失)。可以在《统计学习简介》的第53页中找到该证明。


有另一种方法称为“真实贝叶斯”方法。基本上,您并不是在尝试“选择概率最高的结果,而是概率性地考虑所有情况”,因此,如果有人要求您“预测接下来的100次翻转”,则应该暂停他/她,因为当您给出100个二进制结果时,每个结果的概率信息都消失了。相反,您应该问,知道结果之后要做什么。

假设他/她有一些损失函数(例如0-1损失不是必须的,损失函数可以是,如果您错过了头,则需要支付1 美元,但是如果您错过了尾部,则需要支付5 美元,即损失不平衡),那么您应该利用对结果分布的了解,将整个分布中的损失降到最低

xyp(x,y)L(f(x),y)

,即,将您对损失分配的知识纳入考虑范围,而不是采用“分阶段的方式”,以获得预测并执行下一步。

此外,您对许多可能的结果会产生什么样的结果有很好的直觉。如果结果的数目很大并且概率质量分布广泛,则MAP估计将无法很好地进行。考虑一下您有100个骰子,您知道真正的分布。其中,。现在,您如何使用MAP?您总是会猜到您得到了第一面,因为与其他面相比,它具有最大的概率。但是,您会在的时间内犯错!P S 2= P S 3= P S 100= 0.9 / 99 = 0.009090 S 1 90 P(S1)=0.1P(S2)=P(S3)=P(S100)=0.9/99=0.009090S190%


4
MAP也是贝叶斯。此外,您在描述这两种方法时都没有提到使用先验,这可能会引起误解,因为您正在撰写贝叶斯方法,而先验是这些方法核心功能。

“因此,如果有人要求您“预测接下来的100次”翻转,您应该拒绝这样做。如果有人以正确的预测向我提供了10亿欧元,我可能不会拒绝。或者,您说的“预测”与“尝试猜测”的含义不同。
JiK

“当您给出100个二进制结果时,每个结果的概率信息就会消失”首先,我将其读为“当您给出 100个二进制结果时”,无法理解该句子,但是现在我意识到这可能意味着“当您给出 100个二进制结果”。哪个是正确的,如果是第一个,这意味着什么?
JiK

1
一个非常小的要点:我可能会在第二段之后添加一条垂直线,以指示前两段在技术上足以回答字面问题,而其余的则是一些附加信息(无疑是有趣且有用的)。
JiK

2
在最后一段中:“如果结果数量很多,MAP估计将无法正常工作。--但是,您90%的情况都会出错!” 运作不佳始终是上下文问题。例如,如果这是重复的下注游戏(将彩池分配给正确猜对的人,或者如果没有人猜对,则归还),如果您与例如猜他们的人对战,那么从长远来看,MAP策略势必会赢得很多钱从结果的分布。
JiK

4

由于独立性,如果您猜测最可能的情况,则期望值始终会最大化。没有更好的策略,因为每次掷骰/掷骰不会给您有关硬币/骰子的任何其他信息。

在您猜到不太可能的结果的任何地方,您对获胜的期望都比您对最可能的情况的猜测要少,因此,最好仅对最可能的情况进行猜测。

如果您想做到这一点,而确实需要在翻转时更改策略,则可以考虑使用硬币/骰子,最初您不知道赔率,并且在滚动时必须弄清楚它们。


1
对我来说,这个答案是最简单的解释;如果您必须考虑以前的结果来定义策略,则可以打破“独立”概率。
Walfrat
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.