什么时候 -Nash均衡策略收敛到纳什均衡策略?


9

纳什均衡一般是无可争议的。一个 -Nash平衡是一组,其中,给定的范围内的对手的策略,每个玩家取得策略的最大可能预期报酬的。给定和一个博弈,找到 -Nash平衡是完成的。ϵϵϵϵPPAD

严格按照定义,似乎没有特别的理由相信给定纳什均衡的策略与任何纳什均衡的策略很接近。但是,我们经常看到文献中的意思是说“计算近似纳什均衡”时,有些草率地使用了“近似计算纳什均衡”之类的短语。ϵ

所以,我想知道第二个何时隐含第一个。也就是说,对于什么游戏,我们期望 -Nash平衡与Nash平衡“接近”?ϵ


更正式地说,假设我有一个玩家的游戏,并且有一系列策略配置文件。n(s1(1),,sn(1)),(s1(2),,sn(2)),(s1(3),,sn(3)),

每个都是 -Nash平衡,并且序列收敛为零。(s1(i),,sn(i))ϵiϵ1,ϵ2,ϵ3,

我的问题:

  1. 什么时候(在什么条件/假设下)所有策略收敛?即,对于每个玩家,必定会聚。jsj(1),sj(2),sj(3),

  2. 在什么进一步的条件下,该序列的极限实际上是博弈的纳什均衡?(在我看来,不需要进一步假设;,如果所有策略都收敛,则限制应该是NE。)

  3. 计算 -Nash平衡的算法何时必然意味着近似计算Nash平衡策略的算法?以上条件是否足够?ϵ

非常感谢!


编辑2014-03-19

在阅读了Rahul的答案中的参考文献之后,以分布之间的距离而不是收敛的序列进行思考似乎更为合理。因此,我将尝试重述问题并提出一些近期想法。1

  1. (好吧,这太依赖算法了,无法真正得出答案。在不限制算法的情况下,您可以具有两个不同的纳什均衡,然后,当将小的插入算法时,连续的之间的距离输出会仍然很大,因为输出会在平衡之间振荡。)ϵ1

  2. 假设是一个策略配置文件,即产品在玩家策略上的分布。对于什么游戏,我们可以说是 -Nash均衡暗含对于某些Nash均衡,其中等于?(请注意,如果收益以为界,则相反。)ppϵpq1δqδ0ϵ01

    这实际上是棘手的,因为在复杂性设置中我们所谓的“游戏”实际上是由(纯策略(“动作”)的数量)参数化的一系列游戏。所以就像,相对比率很重要。这是一个简单的反例,显示答案不是“所有游戏”。假设我们修复了递减的序列。然后,对于每个,构造上的两个玩家的游戏动作,其中,如果玩家扮演的第一个动作,他们得到的回报不管其他玩家扮演的是什么; 如果玩家进行第二个动作,他们将获得的收益nnϵ0ϵ1,ϵ2,ϵnn11ϵn不管其他玩家玩什么;并且如果某位玩家进行了其他任何操作,则无论其他玩家玩什么,他们都将获得的收益。0

    因此,每个游戏都有一个平衡点(两者都播放第二个动作),与它唯一的Nash平衡点(两者都播放第一个动作)最大距离。nϵn1

    因此,有两个有趣的子问题:

    1. 对于固定游戏和固定,对于“足够小”的,上述条件成立(所有均衡均接近Nash均衡)。nϵϵ
    2. 也许本质上是相同的问题,但是条件是否成立,即支付收益的差异是否由一个常量。n
  3. 与(2)相同的问题,但与算法计算的实际平衡有关。我猜大概我们将要么获得算法/建设性的答案,要么根本不获得任何答案,因此区别并不重要。


总会有一个极限点,ε平衡子序列会收敛到该极限点,并且该极限将是精确的Nash平衡。混合策略配置文件的空间的紧凑性和效用函数的连续性是混合策略概率的函数,这暗示了这一点。(s1...sn)
Noam 2014年

Answers:


5

以下论文至少将近似均衡的概念形式化为接近精确均衡,并证明了一些相关的结构结果。

Pranjal Awasthi,Maria-Florina Balcan,Avrim Blum,Or Sheffet和Santosh Vempala(2010)。关于近似稳定博弈的纳什均衡。在第三届算法游戏理论国际会议论文集(SAGT'10)中,第78-89页。

特别是,本文举例说明了问题3的一类游戏。


谢谢!我想这是最先进的。我也会在问题中添加一些想法。
usul 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.