什么时候 -Nash均衡策略收敛到纳什均衡策略?
纳什均衡一般是无可争议的。一个 -Nash平衡是一组,其中,给定的范围内的对手的策略,每个玩家取得策略的最大可能预期报酬的。给定和一个博弈,找到 -Nash平衡是完成的。ϵϵ\epsilonϵϵ\epsilonϵϵ\epsilonϵϵ\epsilonPPADPPAD\mathsf{PPAD} 严格按照定义,似乎没有特别的理由相信给定纳什均衡的策略与任何纳什均衡的策略很接近。但是,我们经常看到文献中的意思是说“计算近似纳什均衡”时,有些草率地使用了“近似计算纳什均衡”之类的短语。ϵϵ\epsilon 所以,我想知道第二个何时隐含第一个。也就是说,对于什么游戏,我们期望 -Nash平衡与Nash平衡“接近”?ϵϵ\epsilon 更正式地说,假设我有一个玩家的游戏,并且有一系列策略配置文件。nnn(s(1)1,…,s(1)n),(s(2)1,…,s(2)n),(s(3)1,…,s(3)n),…(s1(1),…,sn(1)),(s1(2),…,sn(2)),(s1(3),…,sn(3)),…(s_1^{(1)},\dots,s_n^{(1)}), (s_1^{(2)},\dots,s_n^{(2)}), (s_1^{(3)},\dots,s_n^{(3)}), \dots 每个都是 -Nash平衡,并且序列收敛为零。(s(i)1,…,s(i)n)(s1(i),…,sn(i))(s_1^{(i)},\dots,s_n^{(i)})ϵiϵi\epsilon_iϵ1,ϵ2,ϵ3,…ϵ1,ϵ2,ϵ3,…\epsilon_1,\epsilon_2,\epsilon_3,\dots 我的问题: 什么时候(在什么条件/假设下)所有策略收敛?即,对于每个玩家,必定会聚。jjjs(1)j,s(2)j,s(3)j,…sj(1),sj(2),sj(3),…s_j^{(1)},s_j^{(2)},s_j^{(3)},\dots 在什么进一步的条件下,该序列的极限实际上是博弈的纳什均衡?(在我看来,不需要进一步假设;即,如果所有策略都收敛,则限制应该是NE。) 计算 -Nash平衡的算法何时必然意味着近似计算Nash平衡策略的算法?以上条件是否足够?ϵϵ\epsilon 非常感谢! 编辑2014-03-19 在阅读了Rahul的答案中的参考文献之后,以分布之间的距离而不是收敛的序列进行思考似乎更为合理。因此,我将尝试重述问题并提出一些近期想法。ℓ1ℓ1\ell_1 (好吧,这太依赖算法了,无法真正得出答案。在不限制算法的情况下,您可以具有两个不同的纳什均衡,然后,当将小的插入算法时,连续的之间的距离输出会仍然很大,因为输出会在平衡之间振荡。)ϵϵ\epsilonℓ1ℓ1\ell_1 假设是一个策略配置文件,即产品在玩家策略上的分布。对于什么游戏,我们可以说是 -Nash均衡暗含对于某些Nash均衡,其中等于?(请注意,如果收益以为界,则相反。)ppppppϵϵ\epsilon∥p−q∥1≤δ‖p−q‖1≤δ\|p - q\|_1 \leq \deltaqqqδ→0δ→0\delta \to 0ϵ→0ϵ→0\epsilon \to 0111 这实际上是棘手的,因为在复杂性设置中我们所谓的“游戏”实际上是由(纯策略(“动作”)的数量)参数化的一系列游戏。所以就像,相对比率很重要。这是一个简单的反例,显示答案不是“所有游戏”。假设我们修复了递减的序列。然后,对于每个,构造上的两个玩家的游戏动作,其中,如果玩家扮演的第一个动作,他们得到的回报不管其他玩家扮演的是什么; 如果玩家进行第二个动作,他们将获得的收益nnnn→∞n→∞n \to \inftyϵ→0ϵ→0\epsilon \to 0ϵ1,ϵ2,…ϵ1,ϵ2,…\epsilon_1,\epsilon_2,\dotsϵnϵn\epsilon_nnnn1111−ϵn1−ϵn1-\epsilon_n不管其他玩家玩什么;并且如果某位玩家进行了其他任何操作,则无论其他玩家玩什么,他们都将获得的收益。000 因此,每个游戏都有一个平衡点(两者都播放第二个动作),与它唯一的Nash平衡点(两者都播放第一个动作)最大距离。nnnϵnϵn\epsilon_nℓ1ℓ1\ell_1 因此,有两个有趣的子问题: 对于固定游戏和固定,对于“足够小”的,上述条件成立(所有均衡均接近Nash均衡)。nnnϵϵ\epsilonϵϵ\epsilon 也许本质上是相同的问题,但是条件是否成立,即支付收益的差异是否由一个常量。n→∞n→∞n \to \infty 与(2)相同的问题,但与算法计算的实际平衡有关。我猜大概我们将要么获得算法/建设性的答案,要么根本不获得任何答案,因此区别并不重要。