最佳随机出价


7

这个问题来自我经常浏览的网站。

两名玩家参加了一个热门的新游戏节目,名为“更高人数获胜”。两者进入不同的展位,每个都按下一个按钮,并且屏幕上出现一个介于零和一之间的随机数。(在这一点上,他们都不知道对方的号码,但是他们确实知道这些号码是从标准均匀分布中选择的。)他们可以选择保留该第一个号码,或者再次按下按钮以丢弃第一个号码并获得第二个号码他们必须保留的随机数。然后,他们走出展位,在墙上看到每个玩家的最终号码。慷慨的大奖-一个装满金条的箱子-奖励给保留较高数字的玩家。玩家舍弃第一个数字并选择另一个数字的最佳截止日期是哪个数字?换句话说,他们应该选择在哪个范围内保留第一个数字,

对于对称玩家,这是一个非常奇怪的拍卖问题(我也假设玩家是风险中立的),或者是一个非常奇怪的彩票/游戏理论游戏。

从数学上来讲,您将如何处理这个问题,您会得到什么答案?有没有奖得到正确的答案,该网站的谜语,我只是好奇。我的直觉告诉我,最佳分界点是0.5,因为您有50-50的机会高于或低于对手的数字,而不管他/她是否拒绝对方的随机数字,但我不确定。


我认为风险中立性与此无关,玩家只是试图最大化获胜的可能性。收益是二进制的,没有安全的平均结果。
吉斯塔德

@denesp从某种意义上说,您可能会厌恶风险,如果您要说0.46,即使您比差的人有更好的机会获得更好的数字,也可能不想重画。
Kitsune Cavalry

1
@KitsuneCavalry我明白您在说什么,但这是一些风险规避的“行为”概念,因为它是在过渡步骤而非最终结果中定义的。
Shane'3

@Shane当然,我听到了。而且我也不太担心。
Kitsune Cavalry

Answers:


6

首先,我将证明0.5(或)的临界点不能作为对称平衡起作用,然后您可以自己决定是否要考虑问题或阅读完整的答案。12

让我们用表示截止点。假设两个玩家都使用策略。让我们分别用和表示玩家和数目,以及用和表示玩家的潜在第二个数目。假设。通过保持这一点,玩家获胜的概率为 这也意味着是cx,cyc=12xyx1y1x2y2x1=23x

P(12y1<23)+P(y1<12)P(y2<23)=16+1223=12.
23此分布的中位数

现在假设。通过保持这一点,玩家获胜的概率为 但是如果他丢弃他的概率为 获胜的。因此保持(及其周围环境)不是最佳的,因此它不是平衡移动。x1=12x

P(y1<12)P(y2<12)=1212=14
x1=12
P(y1<12)P(x2>y2)+P(y112)P(x2>y1)=38
38>14x1=12


踏板警报

如果玩家具有截止值并且玩家抽取并保持该值,则玩家获胜的概率为 如果玩家在哪里丢弃,则获胜的概率为 假设有一个对称的平衡,即。 (我不认为存在其他均衡,但我没有证明这一点。)ycyxx1=cyx

P(y1<cy)P(y2<cy)=cycy=cy2.
xx1
P(y1cy)P(x2>y1)+P(y1<cy)P(x2>y2)=(1cy)(11+cy2)+cy12
cx=cy=c

由于获胜的概率在的值中是连续的,因此临界值使得如果则当保留并将其丢弃时获胜的概率相等。这意味着 x1cx1=cx1
P(y1<c)P(y2<c)=P(y1c)P(x2>y1)+P(y1<c)P(x2>y2)cc=(1c)(11+c2)+c12c2=12c+c22+c212c2+c212=0c=512.


有人做了与您类似的推导,并通过Wolfram计算对它进行了仔细检查:tinyurl.com/j9xey5t所以我要继续说这看起来是正确的。现在,如果您解决了该游戏的一般形式,我将为您提供最佳答案:P Kidding〜(尽管有趣的是,看到游戏如何随着更多的机会重新滚动而变化。)您编辑的截止时间是否意味着两位玩家都有50 %获胜,还是您仍然认为答案有误?
Kitsune Cavalry

@KitsuneCavalry我认为接受它还为时过早,但幸运的是,计算是正确的,我对50%的推理是错误的。临界值是如此之高,以至于抽奖是“幸运的”,因此抽奖您有超过50%获胜的机会。开彩前,您有50%的钱。
吉斯塔德

如果有价值,提出问题的网站就会给出答案。你把钱花了。今天感觉像赢家。您赢得了它B)
Kitsune Cavalry

2

假设人1选择了的临界值,人2选择了的临界值,其中。令为人1的最终数字不大于的概率。如果,则等于否则,则等于。类似地定义。现在在的参数图上针对绘制。结果是三个线段:c1c2c2c1p1(x)xp1(x)c1xx<c1c1x+xc1p2(x)p2(x)p1(x)0x1

  • 从到,对应于;(0,0)(c12,c1c2)0xc1
  • 从到,对应于;(c12,c1c2)(c1c2+c2c1,c22)c1xc2
  • 从到,对应于。(c1c2+c2c1,c22)(1,1)c2x1

这三个线段将单位正方形分为两部分。图表下方部分的面积是人1具有更高数字的概率。一些几何图形显示此区域为。为了保持稳定的平衡,此两个偏导数都必须为零,即12+12(c2c1)(c1c2+c21)

1c22c1c2+c22=01c1+2c2c12+2c1c2=0

加等式显示,这仅在时才可能。代入方程式,则唯一稳定的平衡点是。(c2c1)(1+c1+c2)=0c1=c21c1c12=0c1=c2=512


这是一个很好的答案,但是为什么将平衡称为稳定平衡呢?
吉卡德(Giskard)2016年

1
@denesp我想那是多余的。
F ''
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.