纳什均衡计算算法。


10

我在论坛上搜索了是否曾经问过这个问题,并且在讨论算法博弈论时,我找不到解决的特定问题。我正在尝试找出最有限的n人游戏中用于计算近似(混合策略)纳什均衡的算法。当然,该算法将是PPAD。我对速度/效率比算法的完美准确性更感兴趣。

谢谢菲利普


如果您提供更多详细信息,我们可以为您提供更好的帮助。例如,您要记住哪个值?您是否有任何特殊的收益函数结构?您真的需要纳什均衡还是相关均衡就足够了?您是否正在寻找可证明范围良好或实用性能良好的东西?n
沃伦·舒迪

Answers:


7

简短的答案是,尽管有一些多项式时间算法可证明地找到近似的纳什均衡,但它们都找到了相对较差的近似值-如果您实际上是想找到一种玩游戏的算法,可能还不够好。2个玩家游戏比n个玩家游戏了解更多。

如果您实际上想找到一个(近似)纳什均衡,那么您可能要尝试编写的一件容易编写的代码就是模拟游戏玩法,每个玩家都使用随机加权多数算法(http://en.wikipedia.org/ Wiki / Randomized_weighted_majority_algorithm)。这不能保证能正常工作,但在许多情况下还是可以的(并且保证在某些类型的游戏中,例如零和游戏)。特别地,如果该过程完全收敛,则可以保证收敛至纳什均衡。危险在于它不会收敛,不会永远循环-但是即使在这种情况下,游戏经验的历史也会收敛到一组粗糙的相关均衡。


我开始看一下上面答案中提到的论文。我不了解所有内容(或乍看之下的大部分内容)...您能解释一下为什么近似值“相对较差”吗?另外,您能否简要解释一下“粗相关均衡”是什么?我知道什么是相关均衡,但是对于这样的均衡来说意味着什么。变得粗糙。最后,您所说的“游戏的经验历史将趋同……[等等]”是什么意思?永不收敛的事物如何收敛到一组CCE?感谢您的回答,我现在正在查阅Wikipedia文章。
菲利普·怀特2010年

对于一些算法的背景知识,这些算法产生的分布收敛到粗略相关均衡或相关均衡,我从这里开始:cs.cmu.edu/~avrim/Papers/regret-chapter.pdf
Aaron Roth,2010年

如果您想要一个相关的均衡而不是一个粗糙的相关均衡,那么您可以使用一个无内-悔的学习者。例如(无耻的插件)cs.brown.edu/~ws/papers/regret.pdf。也有直接在多项式时间内计算相关平衡的算法。
沃伦·舒迪


4

如果您对实际在软件中实现的算法感兴趣,那么我就知道其中几种:

  1. GAMBIT程序包(http://www.gambit-project.org/doc/index.html)为2人和n人正常形式,在某些情况下还包括扩展形式的游戏,实现了几种纳什均衡算法。

  2. GameTracer(http://dags.stanford.edu/Games/gametracer.html)为n玩家普通形式的游戏实现了Govindan&Wilson的GNM和IPA算法。

  3. 对于大型游戏,随着玩家数量的成倍增长,正常的形式表示存在问题。相反,如果您游戏的效用函数具有某种结构,则可以使用“简洁表示”(例如图形游戏,对称游戏,动作图游戏)来使用更少的空间来表达它;而且该结构通常可以用于计算加速。在软件方面,AGG解算器(http://agg.cs.ubc.ca)使GameTracer的GNM算法和GAMBIT的simpdiv算法适应于动作图形游戏(AGG)表示。(免责声明:我参与了该软件包装的开发。)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.