接收方应何时在信令游戏中随机分配各种动作?


10

假设存在一个带有有限消息空间,有限动作空间和有限类型空间的信号博弈。更简单的是,所有发送者类型都具有相同的首选项(接收者只喜欢响应不同类型的不同操作)。接收者是否可以通过随机分配响应严格地做得更好?当均衡存在时,接收方只采取纯粹的行动?Ť中号一种Ť

无处不在很好地概括了我的问题:“是否曾经有过具有最高接收者收益的均衡必然涉及混合策略?”

让我们进行顺序均衡。如果您想以某种符号开头。

σŤ是中的发送的概率。中号ŤŤ中号

σ[R一种是接收者以响应的概率观察了后给出了接收者的信念。一个μ ∈ Δ Ť 一种一种 μΔŤ

一个顺序均衡要求给予最佳响应给定,是给出最佳和被贝叶斯给出。这实际上是弱顺序的定义,但是在信号博弈中没有区别。σ - [R σ - [R μ μ σσŤσ[Rσ[Rμμσ

我的直觉说,如果存在一个平衡点,即接收者只扮演纯粹的角色,则不会,但是我一直对这种东西感到恐惧。也许我们还必须规定它不是零和游戏,但我之所以这么说是因为我记得玩家在这些游戏中具有随机化的能力会更好。也许这是某处论文的脚注?

考虑以下游戏,其中发件人首选项不同。我为低质量表示歉意。有三种发送者类型,每种发送者的可能性均等。只有当接收者(玩家2)在接收到消息1时随机化之后,我们才能创造出我认为是接收者(玩家2)的最佳均衡。然后类型1和3将发挥,从而产生分离均衡。如果接收方使用纯策略来响应,则类型1或2将偏离并导致接收方的状况恶化。m 121个

σ[R1个一种=.5=σ[R1个[R=.5

在此处输入图片说明


接收者根据类型采取的操作会影响发送者发送的消息还是这些独立的消息?
Martin Van der Linden 2014年

我不确定你的意思。有一种接收器类型。他们的策略将消息映射到行动上的分布中。仅在发件人发挥最佳响应的范围内,它们才对邮件有影响。
2014年

2
假设存在一个平衡点,其中接收者在一组动作随机化。根据定义,这意味着他必须对α上的任何两个概率分布都无动于衷-包括所有权重都放在一个动作上的概率分布(纯策略)。因此,不能,混合策略绝对不能比最佳的纯策略更好。还是我误解了这个问题?αα
无处不在

@Ubiquitous对我来说很有意义,但我想知道是否可能存在一些奇怪的病理情况。例如,我只能找到一个定理:“对于具有完美召回力的有限扩展形式游戏中收益的一般选择,收益在顺序均衡的每个相关部分都是恒定的。” 普遍的警告使我感到奇怪。
汉堡2014年

1
@Pburg是的,我知道了。看来我们想到了不同的问题。我当时在想:“ 对于给定的发送方策略,接收方独特的最佳响应是否曾经是混合策略?”,而您的问题似乎实际上是:“具有最高接收者收益的均衡必然涉及到这种情况吗?混合策略?”
无处不在

Answers:


3

也许我有一个反例!

要有三个消息,3,和三个发送器类型123其中= 3= 11个23Ť1个Ť2Ť3Prt=t2=1Ť=Ť3=1个2-ϵPrt=t1=1Ť=Ť2=1个4。发送m3会为发送者带来0的收益,我们可以认为这是退出游戏。Ť=Ť1个=1个4+ϵ30

接收者对消息响应为{ a r }=1个2{一种[R}

üŤ一种1个=1个>üŤ一种2=β>üŤ[R=0

u Rt 3m ia = 1ü[RŤ1个1个一种=ü[RŤ22一种=2ü[RŤ3一世一种=1个

Ü - [R 3中号- [R = 2ü[RŤ21个一种=ü[RŤ21个一种=0ü[RŤ3一世[R=2

ü[RŤ1个一世[R=ü[RŤ2一世[R=1个

那么在平衡状态下,所有发送者都必须获得相同的效用,对吗?否则,一个人会模仿另一个人的策略。

因此,唯一的纯策略均衡是让所有发送方都选择。在m 1m 2上的汇集平衡中,最佳响应是选择r。除了t 1t 2发送m 2,并且接收方以r响应之外,没有任何分离平衡的纯策略。那么t 3对于所有消息都是无关紧要的,因为肯定会遇到收益0。所有这些使接收者得到331个2[RŤ1个Ť22[RŤ3032-ϵ

其中再考虑的情况下σ 2 - [R = 1。现在,发件人是发送这些两个消息之间漠不关心。然后,让σ 31= ε + 1 / 4σ[R1个一种=βσ[R2一种=1。σ=1对于=12。那么接收者策略是合理的。σt3(m1)=ϵ+1/4ϵ+1/2=1σt31个σŤ一世一世=1个一世=1个2

给定ar,的接收者的期望效用为1.5。给定am 2的预期效用略高于1.5 。因此事前预期收益高于31个一种[R2一种,比上述的纯平衡更好。此外,这种分离仅通过混合来维持。接收者采取的任何其他纯策略都会引起发送者汇集,这意味着唯一的纯策略均衡是接收者选择r时32-ϵ[R

在下图中,我应该有,以使左侧发件人获得a的收益。我认为β < 1是关键因素。β一种β<1个

在此处输入图片说明


3

我想,这不能回避风险的发送者,风险中性的接收器,并发生不够丰富。一种

例如,并且坚持到经典信号模型,假设是正实线和发件人的效用ü在增加一个,而接收机具有线性效用递减一种ü一种一种

(诚​​然,这只是部分答案,因为该框架的普遍性要比您所提出的框架小得多,因此它可能对您不满意。如果您对这些假设还可以,我仍然提供一个论据)

以导出矛盾,假设在平衡σ - [R > 0对于某些一个'一个。让σ[R一种>0σ[R一种''>0一种一种''一种

一种σ[R一种σ[R一种+σ[R一种''一种+σ[R一种''σ[R一种+σ[R一种''一种''

通过规避风险

[σ- [R '+σ- [R ]û一个''' >σ- [R 'ù一个'+σ- [R

ü[一种]>σ[R一种σ[R一种+σ[R一种''ü一种+σ[R一种''σ[R一种+σ[R一种''ü一种''
[σ[R一种+σ[R一种'']ü一种>σ[R一种ü一种+σ[R一种''ü一种''

在某种连续性假设下,还必须存在

一种<一种

这样

[σ[R一种+σ[R一种'']ü一种=σ[R一种ü一种+σ[R一种''ü一种''

σ[R

  • σ[R一种=σ[R一种''=0
  • σ[R一种=σ[R一种+[σ[R一种+σ[R一种'']
  • 一种σ[R一种=σ[R一种

σ[Rσ[R σ[Rσ[Rσ[Rσ[R


一种=0

一种

那么,“接收者的线性效用降低a”是什么意思?
汉堡2014年

抱歉,不是很清楚。在我想到的Spence信号模型中,接收方采取的行动包括向发送方支付工资w。接收方效用取决于发送方t的类型,减去支付的工资t-w。基本上,接收者是风险中立的:她只在乎她将要支付的预期工资,以及她将雇用的预期类型。
Martin Van der Linden 2014年

-Ť-w2
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.