纳什均衡的计算有界形式?


14

我想知道纳什均衡概念是否有计算上的局限性,类似于以下内容。

想象一下一种在板上玩的两人完美信息游戏,在最佳玩法很难EXPEX的意义上,它是复杂的。为了简单起见,也假设不可能绘制。想象一下一对A B 随机多项式时间Turing机器彼此对战。对于每个n,令p A Bn An次博弈中击败B的概率。(具体来说,假设An×n(A,B)npA,B(n)ABnA首先以概率0.5进行比赛。)我认为很酷的是,如果可以证明一对具有以下特性:没有随机多项式时间图灵机A '支配A(其中“ A '占主导地位 “是指p 'ñ > p ñ 对于所有足够大ñ),并且类似地没有随机多项式时间图灵机'(A,B)A AAApA,B(n)>pA,B(n)nB占主导地位(其中,“ 支配 ”的意思p 'Ñ < p Ñ 对于所有足够大Ñ)。BBBpA,B(n)<pA,B(n)n

不知何故,我怀疑这实在是太希望了,但是对于像这样的受限游戏来说,这样的事情真的有希望吗?

这个问题的动机是,我正在寻找一种方式来规范给定棋位置“对怀特有利”的观念。传统上,一个职位对怀特来说是胜利,或者不是。但是,无论是人还是计算机的国际象棋选手都对怀特拥有优势的含义有直观的了解。鉴于玩家在计算上受限制并且必须猜测最佳移动,这似乎与怀特获胜的可能性有关。对于特定对随机算法当然谈论白赢,但我想知道是,如果有可能,在一定意义上,一个概率的一个CAN 规范 一对具有计算边界的玩家,其获胜概率产生的位置值仅取决于游戏本身,而不取决于玩家的特质。


我所知道的以计算为界的均衡概念具有不同的风格-对Halpern,Pass和Seeman的思考,就像 2014年民间定理神话背后的真相》。很难(因为对于给定的游戏,可能会或可能不会)。相反,如果任何参与者都难以计算出有利可图的偏差,则我们允许将任何策略设置为均衡。(请注意,这是假设指数策略空间,否则我们可以检查所有偏差。)
usul 2014年

Answers:


1

我想不出任何简单,完全优雅/令人满意的答案来回答这个问题,特别是因为期末收益很难计算。但是,我的想法太长了,无法发表评论。

我最好的主意是:对于国际象棋,尝试根据给定位置的白方物质优势(即额外的棋子,骑士等),估算白方获胜的概率,方法是随机选择确切数量的方阵材料配置。也许在“全能国际象棋”的情况下,我们可以说,“怀特以8杆赢得黑棋的17杆赢得胜利的可能性有多大?” 也许这个概率是4%;要计算它,我们将必须检查(说)1000个随机生成的棋位置,这些位置有8个白嘴和17个黑嘴,然后向前看(说)每种情况下有10个深处,并查看新的材料配置是什么。然后,根据最后的材料配置得出预期的赔率,

当然,有必要找到M个白嘴鸦到N个黑嘴鸦的每个相关可能性(MN)的材料配置...大概从最低顺序对(M = 1,N = 1)开始工作从那里。

对于原始位置,不要仅仅遵循获得的统计数据(即,如果原始位置具有(M = 6,N = 7)车手,不要仅仅假设怀特有25%的获胜机会,因为(6,7)的预期获胜几率); 相反,因为您可以更精确地进行搜索,所以仅凭此位置看10个动作就可以像往常一样深入并找到每个可能的结束位置。然后,找到通往10个动作深度配置的正确路径(涉及双方的最佳比赛),然后选择该路径的预期赔率作为原始位置的预期赔率。

我认为这个过程可以在多项式时间内完成。寻找ķ移动深固定ķ在国际象棋是在板的尺寸多项式,以及白色和黑色乌鸦总数一元表示(在某种意义上),因为该数量必须比基板的尺寸更小。

如果这听起来很复杂且难以解释,那是因为。我要描述的内容更简洁明了:使用递归和基本统计​​数据来计算给定板上有M个白嘴鸦和N个黑嘴鸦的白人的获胜几率。然后使用这些值查看k的移动深度,并确定White将在原始位置获胜的几率。

最后的评论:我认为这个问题对于非EXPTIME完整的游戏(例如井字游戏)也很有趣,根据Wikipedia所述,该游戏是PSPACE完整的。此外,我相信像我上面描述的那样的过程也可以在这里使用,尽管显然不可能在井字游戏中拥有“实质性”的优势。判断X或O的位置是否优越还必须有其他基础。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.