解释一次性游戏的混合策略


13

在对非合作博弈理论的经典介绍中,将玩家的混合策略作为玩家策略空间上的分布进行教授。该分布实质上为我们提供了玩家应在纳什均衡中玩策略的概率(例如,离散策略集)。

然而,概率带有频率的概念,而这些本质上意味着玩家应在其中进行策略的长期游戏。但是该设置是单机游戏,这是一个矛盾。

在解释什么是混合策略时,我们如何解决矛盾?


2
这与采用概率的倾向性解释的人并不矛盾,后者将长期行为视为单例概率的表现。
2014年

Answers:


11

阿里尔·鲁宾斯坦(Ariel Rubinstein)倾向于对这类问题有见识。

他谈到的混合策略在第3节解释这个文件。

除了故意随机化以外,还有几种可能的解释:

  1. 纯化:混合策略是基于模型中未指定信息的行动计划。
  2. 一个虚构的长期故事。
  3. 人口平均数,因此可以想象玩家被某种人口分布所吸引,其中不同类型的人使用不同的纯策略。人口分布是混合策略分布。

关于玩家的混合策略的有趣引述反映了i关于将做什么的不确定性:iii

可以将混合策略视为所有其他玩家对玩家行为的信念。这样,混合策略均衡就是常识期望的n元组,​​其性质是,在给定信念的情况下,分配有严格正概率的所有动作都是最优的。即使不是这种情况,所有其他玩家也可能将玩家的行为视为随机设备的结果。采用这种解释要求对许多应用博弈论进行重新评估。特别是,这意味着均衡不会导致玩家行为的预测(统计或其他方式)。考虑到他对其他玩家的期望,我的任何动作都是最好的回应 行为(其他n-1个策略)与i动作(这可能包括混合策略无法支持的动作)的预测一致。这使得对混合策略均衡的任何比较静态分析或福利分析都变得毫无意义,并质疑利用混合策略均衡的大量经济学文献。


6

表示一种将概率附加到下注A B上的策略,而s = { s is i } i是在a中导致均衡的策略的集合。两人对称游戏。si={pAi,pBi}A,Bs={si,si}i

sis

至少在混合策略均衡下,我们知道每种均衡发生的可能性。在某种程度上,您不喜欢概率携带频率,这与单打游戏的概念相矛盾。

spA{A,A}pB

stδ0

TTpA{A,A}


2

这是对Pburg报价的补充:

NS:=×iNSisS

  1. iπi:SSiiisiπi1(si)πi1(si)si
  2. Aiiai:SAiai|πi1(si)
  3. igiaig(s):ARsπi1(si)si

1

好吧,这是我的答案,下面是《物理》http://bayes.wustl.edu/etj/articles/prob.in.qm.pdf上的这篇论文。我认为,倾向性是混合策略的很好的解释,但从形式上来说,我们应该说它抓住了建模者的无知。我们说,不管怎么说,实际上所有策略都可以采用(如果支持到处都是积极的),但是解决方案概念表明某些可能性更大。这里的概率衡量了建模者的无知,这是缺乏游戏理论家有关游戏的信息的结果。为了弄清这种增强的数据集的思想,我们在其中了解有关游戏的更多信息,比如说我们与一名玩家交谈,他向我们保证无论如何他都会采取一种策略,那么我们可以在游戏中做出更清晰的预测纯粹策略的形式。当我们将游戏视为典型游戏时,频率就会升高,


0

它并不适用于所有游戏,但在某些情况下(至少某些)玩家实际上在游戏中使用随机设备,这种情况可能被视为一次性操作。在此,概率分布不是频率,而是随机设备使用的分布。因此,任何混合战略均衡都是事前的均衡(尽管玩家很可能会一次从随机设备中抽出资金,并且事后情况可能不会达到均衡)。

示例包括:

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.