奥斯本,纳什均衡和信仰的正确性


12

在奥斯本的“博弈论概论”中,纳什均衡描述如下(第21-22页):

首先,每个玩家根据理性选择的模型选择她的行动,因为她对其他玩家的行为有所信仰。其次,每个玩家对其他玩家行为的信念都是正确的。

在我看来,这个定义并不完全等同于纳什均衡的通常定义,作为一种战略形象,其中每个玩家的战略是对其他战略的最佳反应。

通常的定义没有说明信仰,因此允许信念可能不正确。

要琐碎的可能性,请考虑囚徒的困境。假设每个玩家都认为其他玩家不会承认。由于忏悔是一种主导策略,每个玩家仍然会承认。因此,即使玩家的信念完全与实际的均衡行为相反,这些行为构成了纳什均衡。

我是否正确地理解奥斯本的定义是否与纳什的均衡有关?


不是“通常的定义没有说明信仰,因此允许信念可能不正确。” 简单地说,你总是在这些定义中有一个潜在的合理性假设这一事实?
Thorst 2014年

Answers:


9

在这里引入信仰语言有点奇怪,因为信念在博弈论的其他部分确实具有非常特殊的含义。

事实上,奥斯本的描述让人联想到贝叶斯纳什均衡。我们可以介绍信仰的概念变成一个完全信息博弈的正常形式如下:假设的概率每个球员,是一个“战略性” 类型谁将会根据(纳什)均衡发挥,并以概率1 - 一个,他会随机均匀选择一些策略(因为,说,他是在所有的行动无所谓)。因此,我们有一个贝叶斯游戏,思考信仰更自然。aii1ai

贝叶斯纳什解决方案的概念然后说,的策略必须是最佳的,因为其他玩家的策略引起的预期游戏以及{ a j } j i暗示的类型的信念。如果我们将极限看作所有i i1,那么这个游戏的贝叶斯纳什均衡将与奥斯本描述的解决方案概念一致。i{aj}jiai1i


我猜奥斯本这样写它的原因是一个教学法,因为这是一个介绍性的文本。当我们向学生介绍静态游戏时,我们告诉他们玩家最能回应其他玩家的行为。学生们自然想知道“他们如何能够在不知道策略是什么的情况下同时选择一个策略?” 从许多方面来说,这是一个哲学问题。常见的答案是i

  • 如果游戏是经常玩的游戏(抛开可以在重复游戏中维持的其他结果的问题),我们可以认为纳什是一种均衡,即如果我们在那里融合,我们就可以形成一种规范,让人们继续无限期地发挥这种平衡(并期望其他人也这样做)。
  • 如果游戏真的是一次性的,那么我们通常会调用玩家将试图预测别人会做什么的想法 - 我们的均衡概念嵌入了这些预测必须正确的观点。

似乎第二点的预测与奥斯本引用的“信念”相对应。然而,重要的是要强调这些预测/“信念”仅仅是一种非正式/直观的工具,可以帮助我们概念化均衡中发生的事情,而不是这种均衡定义的一部分。纳什均衡的概念本身对于信念的概念是完全不可知的(正如你在评论中指出的那样,它只是在行动上定义),这就是为什么当奥斯本继续正式定义纳什均衡时,他这样做而不调用信仰的想法。


4

引入信念使得NE的概念与PBE和顺序均衡等其他细化概念相当,但NE的含义没有改变。

Mas-Colell,Whinston和Green(MWG)的研究生微型教科书就是这样的结果

命题9.C.1。甲策略简档是一个广泛的形式游戏的纳什均衡Γ È当且仅当存在信仰体系μ,使得σΓEμ

  1. 在所有信息集H处,给定置信系统μ使得策略简档顺序合理,使得 Pr H | σ > 0σμ HPr(H|σ)>0
  2. 信仰系统尽可能通过贝叶斯规则从战略概况。σμσ

因此,你给出了囚徒困境的例子,即玩家的信念与对手的实际策略不符合第二个条件,这要求信念尽可能从贝叶斯的规则中得出。事实上,这是奥斯本定义的第二个要求的数学等价物:玩家对其他玩家行为的信念是正确的。


我认为MWG和奥斯本之间存在差异。MWG表示,对于纳什均衡而言,“存在”一种信念体系,使其变得合情合理。我们对玩家实际拥有的信念(如果有的话)保持沉默。奥斯本说球员实际上有信仰,他们是正确的。我认为后者改变了NE的概念意义,因为通常的定义根本没有提到信念,而囚徒困境的例子表明这些策略并不能唯一地确定信念。
Jyotirmoy Bhattacharya 2014年

@JyotirmoyBhattacharya:我认为MWG并不“沉默于什么样的信念,如果有的话,玩家实际拥有”。命题的条件2实际上要求尽可能使用贝叶斯规则从均衡策略概况推导出该信念。因此,在PD示例中,当一个玩家选择概率为1的缺陷时,另一个玩家的信念也必须将概率1置于动作缺陷上并且给出这样的信念的最佳响应(这导致他也选择缺陷)。
Herr K.

@JyotirmoyBhattacharya:NE的信仰不一定是唯一的。这是因为如果对于给定的均衡,游戏树上的路径以概率为零,则贝叶斯规则不适用,因此对该路径的任何信念在NE中将被视为“正确”。这也是引入顺序均衡等优化的原因,以排除平衡路径之外的不合理信念。
Herr K.

@JyotirmoyBhattacharya:另外,因为它是一本本科教科书,因此出于教学原因,奥斯本可能会选择一种比数学上更严格的语言。对我来说,Osborne定义中的两个条件是MWG命题中的精确对应物。
Herr K.

3

你的囚徒困境的例子才有效,因为这是一个具有主导策略的游戏。奥斯本是正确的。

为了最好地回应其他玩家的策略,就像你给出的定义一样,我必须知道他们的策略。换句话说,我必须相信他们正在做的事情,这些信念必须是正确的。这是对可合理性概念的强化。

σ μ 2(σ,μ1)(σ,μ2)μ2σΣσiBi(σi)......“我认为这意味着定义信念是不必要的,因为信念正是对策略概况的正确评估。参考,我的一本书,它给出了Nash(1950)引用的通常定义,以及然后继续讨论两个基本假设:一个是正确的信念,另一个是理性的假设。


但是为了反驳一些例子就足够了。如果你认为Osborne声称他的定义与Nash相同,那么如何处理囚徒困境的反例。我理解奥斯本的定义是对可理性的强化,我认为这不是纳什均衡,原因在于这里的均衡是在行为和信念上定义的,而纳什均衡对信念完全保持沉默。
Jyotirmoy Bhattacharya 2014年

1
这是一个定义,而不是证据。
Pburg 2014年

很公平。但它是一个概念的定义,已经有另一个广为接受的定义。所以我希望如果作者没有提到其他情况,他就声称这两个定义是等价的。
Jyotirmoy Bhattacharya 2014年

要明确的是,他是否在定义或讨论中包含了这些评论?PS我编辑我的答案
Pburg

我引用的部分是讨论。紧接着他说(第22页)“这两个组成部分体现在以下定义中”,然后根据对策略的最佳反应给出标准定义,而这些策略根本没有提到信念。那么定义中体现的信念在哪里呢?问题不仅在于具有主导战略的游戏。很有可能建立没有主导策略的例子,但纳什均衡策略是对不同于均衡游戏的信念的最佳回应。
Jyotirmoy Bhattacharya 2014年

2

我可能会重复以前说过的话,但这是我对此的看法。

我认为在比较两种不同的模型时我们会遇到一个常见问题。“等价”意味着什么并不完全明显,因为这两个定义存在于不同的世界或不同的模型中。但是,如果“等价”被正确定义,我认为人们可以理解奥斯本的定义,并表明它确实与NE相当。

引用部分的解决方案概念如下所示:

sbi

ui(si | si=bi)ui(s | si=bi) for all sSi
bi=si

p

这是棘手的部分。“每个NE都是BE”是什么意思?当然不是“NE和任何信仰概况都是BE”,正如OP在他的反例中所表明的那样。然而,情况是“任何NE都可以成为某些信仰概况的BE ”。我认为从这个意义上说,人们应该理解奥斯本的“等同”主张

请注意,我们还有以下更多“等效”声明:“ 当且仅当它是BE结果时,游戏的结果才是NE结果”。


但是,每个BE都不是NE,因为BE概念弱化了可合理性,我们严格弱于NE。
Jyotirmoy Bhattacharya 2014年

正如我写的那样,我很难理解BE“不是”NE的含义,因为它们似乎生活在不同的模型中。你的意思是在BE上玩的一些策略不是NE吗?我认为这是不正确的,但我可能错过了一些东西。如果这就是你的意思,你能指出我反对的例子吗?这将非常有帮助。
Martin Van der Linden 2014年

我不确定BE是否可以合理化。根据我的理解,BE是合理化的,同时也是猜想正确的条件,对吧?如果这是正确的,那么我们不会比合理化更强大吗?(它当然可能取决于所谓的“弱/强”解决方案概念)
Martin Van der Linden 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.