Questions tagged «game-theory»

博弈论是对两个或多个参与者之间的战略互动情况的研究,其中存在一组预定义的规则以及与每个选择相关的结果。

1
纳什均衡比它还重要吗?
(对模糊的标题感到抱歉,想不出更多有用的信息。随时提出改进建议) 这个问题有点是“奥斯本,纳什均衡和信念的正确性”的概括。考虑正常形式的游戏 G=⟨P,S,U⟩G=⟨P,S,U⟩G = \langle P, S, U \rangle与 P={1,…,m}P={1,…,m}P = \{1,\dots, m\}这组玩家, S={S1,…,Sm}S={S1,…,Sm}S =\{S_1,\dots,S_m\}P中玩家纯策略的mmm元组PPP U={u1,…,um}U={u1,…,um}U = \{u_1,\dots,u_m\}P中玩家支付功能的mmm元组PPP 结构GGG足够丰富,可以定义纳什均衡(NE)的概念。 但是,作者有时会基于更丰富的模型来描述NE。例如,奥斯本在“奥斯本,纳什均衡和信念的正确性”中讨论的描述取决于一个结构 G^=⟨P,S,B,U⟩G^=⟨P,S,B,U⟩\hat{G} = \langle P, S, B, U \rangle与 P={1,…,m}P={1,…,m}P = \{1,\dots, m\}这组玩家, S={S1,…,Sm}S={S1,…,Sm}S =\{S_1,\dots,S_m\}P中玩家纯策略的mmm元组PPP B={B1,…,Bm}B={B1,…,Bm}B = \{B_1,\dots,B_m\}P中玩家对彼此行为的可能信念的mmm元组PPP U={u1,…,um}U={u1,…,um}U = \{u_1,\dots,u_m\}P中玩家支付功能的mmm元组PPP 在此设置中,NE等效于 一个策略组合s∗s∗s^*和信念曲线b∗b∗b^*在所有i∈Pi∈Pi\in P ui(s∗i | s−i=b∗i)≥ui(s′ | s−i=b∗i) for all …

0
最佳战斗钱包和拳击策略
以下是此方案中所有参与者可用的所有公共信息。 一般设置 在乌龟和野兔之间的臭名昭着的比赛之后,咸兔子在垃圾桶里跟垃圾说话。事情发生了变化,两人决定用ñNN轮拳击比赛解决他们在戒指中的分歧。拥有场地的房屋经理想知道如何设置三件事:场地门票价格pŤptp_t,两个战士的合并保证工资的大小w ^ww,以及去战斗钱包的门票销售比例,表示为pFpfp_f。其他动物怀疑战斗机的报酬可能会影响战斗的强度,并且想知道战斗是否有趣。 一拼票为每个消费者支付的效用是üĴ(E (Σi = 1ñËŤ 我+ e^ h 我),v, pŤ)uj(E(∑i=1Neti+ehi),v,pt)u_j(\mathbb{E}\left(\sum_{i=1}^{N} e_{ti} + e_{hi}\right), v, p_t) 也就是说,由龟和整个野兔施加预计总工作量回合,数v ≤ Ĵ其他动物谁在排队买了票,和机票价格的p 牛逼什么影响效用。如果买票的效用为0或更高,动物将排队买票。我们将说第一个和第二个参数中的u j严格增加,第三个参数严格减少,并且所有动物都是风险规避(所以凹实用)。房屋经理设定了一个场地价格,并且在战斗开始和门票销售接近之前不会一直改变(这是一种文化事物)。ñNNv ≤ Ĵv≤Jv \leq JpŤptp_t000üĴuju_j 战斗 前售票开放,和房子的经理取得了他的决定后,两个战士必须就如何将总拼钱包分裂基于谁胜谁败,其中X是门票的总数最终被出售。获胜者获得战斗钱包F的一小部分。合并的房屋工资w在两个战士之间平均分配。每个战斗机在战斗中使用的努力/能量存量分别表示为乌龟和野兔的E t和E h,其中E t &lt; E hpFpŤXpfptxp_f p_t xXxxFFFw ^wwËŤEtE_tËHEhE_hËŤ&lt; EHEt&lt;EhE_t < E_h。能量的战斗机总消耗量是:F∈ { t ,h }f∈{t,h}f \in \{t, h\} Σi = …

1
帮助改进“游戏”的定义?
我的教授定义了一个 游戏 如下: 一组$ n $玩家 每个玩家$ i $的一套策略$ s_i $ 每个玩家$ i $的一组收益$ p_i $ 轮流:顺序或同时 重复:$ k $轮次,其中$ k \ geq1 $和$ k \ in \ Bbb {N} $ 这个定义有三个问题: 他没有用数学方法定义轮换,所以我觉得这是一个模糊的定义。应该有一个可能的转折指数,最大值为$ n $。但我不确定如何正式写它。 他没有定义我们如何从选择的策略映射到支付。据推测,这组收益应包括所选策略的每种可能组合的值。但是应该有一种方式来正式说明这一点。 他没有定义战略是什么。我想人们可以简单地说,策略是我们从域中映射到付费集合中的元素(即codomain)的对象。从这个意义上说,任何可以被重视的东西 是 策略,即可能的行动。 我的问题: 有人可以提供比给定的更完整的定义吗?具体来说,确保它改善了我提到的问题。

2
是否存在不能用游戏树表示的游戏?
是否存在不能用扩展形式或游戏树表示的有限游戏? 我知道许多游戏太长且太复杂,无法用合理大小的树来表示,但这并不是我想要的,因为它在某种程度上是计算上的限制。 相反,我想知道是否有简单的东西不适合广泛的形式?我读过的所有书都说 树木可以代表各种游戏 但是我还没有在任何地方看到“所有游戏”的说法。是否有任何已知的例外情况?


1
使用替代方法证明纳什均衡的存在
大多数标准书籍/论文/阅读材料通过吸引Sperner的引理或Brouwer's / Kakutani的FPT来证明/陈述纳什均衡的存在。然而,我最近才知道存在可以通过其他方式证明,尽管我无法找到任何相关材料。 我的问题是,是否真的有可能使用其他一些结果证明存在纳什均衡? 我真的很感激任何帮助。

1
如何计算/估计博弈论中的支付价值?
在纳什均衡等博弈论中,每个参与者的每个潜在策略的收益值究竟是如何产生的?在我在学术论文中看到的常见的2x2矩阵中,各种支付值似乎只是“出现”在矩阵中而没有解释它们是如何得出/计算/估计的,无论这些值是否具有(或需要)与他们相关的置信度等等。例如,对于给定的玩家/策略选择,是否有可能获得一系列支付值而不是单个数字?

1
作弊的经济动机是什么?实验如何捕获外生偏差?
在我的本科生涯中,我的班级进行了一项经济实验: 一类是控制 两个班是实验(我在实验班) 基本前提是改变了囚犯的困境,而两个人必须就是否“作弊”作出决定。由于这是一个两阶段游戏,第一个人可以选择是否会欺骗第二个。第二种可以选择合作或欺骗。每个人都在不同的班级,以防止串通。 选择作弊的个人的货币价值(美元)为1,如果一个人欺骗另一个,则为3,如果两者合作则为3。 尽管如此,实验本身进展顺利,没有打嗝。但我通过以下方式接近了PI的实验: 当你已经确定了作弊的选择时,这对于人群中愿意偏离既定规则的个人来说是一个很差的衡量标准,社会中普遍存在的问题往往是基于寻找被忽视的漏洞,模糊机制或完全非法意味着获得优于竞争对手的优势。结果,该实验中的结果是预先确定的,并不代表随机且有时混乱的经济结构。 如果您想探索行为经济学的另一种衡量标准,那就寻找那些在欺骗行为中独一无二的人。谁超越了你摆在他们面前的规则,并寻求其他方法来最大化收益。 一个例子:鉴于实验是按顺序进行的,一个以前上课的学生将实验的细节作为杠杆作为回报获得更大的金钱奖励,威胁要披露细节(实际上是勒索)。个人层面的分析得出的结论是,学生意识到可以拥有更大的“底池”资金(如果总课程规模为100,那么预算至少为500美元,以涵盖每个人都合作的情况)以及手头的选项:根据实验规则(1,3或5支付)进行游戏,或者不向实验者敲诈以获得更大的回报(&gt; 5但&lt;500)。从实验者的角度来看,支付流氓学生的费用略高,在此过程中, 当然,我完全知道现实世界中的偏离本身会构成犯罪,并且当时和现在都可能受到刑事起诉。但是,这并不能阻止犯罪,因为犯下了为犯罪获利而犯下的罪行。 虽然回答是“我们希望你不告诉其他班级关于实验的回答”,但我反驳说我的目标不是赚取金钱,而是想了解更多有关实验方法和参数的信息。 基本前提仍然没有答案。当经济实验被设计为具有道德和不道德决定的预定结果时,它如何解决历史记录中存在的极端偏差?安然,伯纳德麦道夫,亚瑟安德森,仅举几例。 我相信我错过了一些与实验相关的文学研究,并对任何建议持开放态度。

2
关于具有重叠策略的均衡路径的信念
这是一个基本问题,但我找不到答案。简而言之,均衡通常取决于特定的策略。例如,给定A的策略,B将其信念更新为xyz。我的问题是,对于许多不同的策略来说,动作通常可能是均衡路径的一部分,那么B如何知道A遵循的是哪种策略? 下面是一个示例,可以阐明问题。 考虑一个经典的信号游戏(2种类型,2个动作)àSpence。此外,假设存在两个平衡:一个平衡,一个平衡。例如,在合并等式中,两种类型的发送者都发送“低”。在分离中,“强”类型发送高,弱类型发送低。 我苦苦挣扎的部分是:接收器如何知道它们所处的平衡路径?例如,假设接收方观察到“低”。如果我们处于“池中世界”中,那么接收者的后继者将只是她的先验。但是,如果我们处于“分离的世界”中,那么她可以更新为p(Weak | Low)= 1。但是,仅观察“低”并不能告诉接收者发送者所遵循的策略,那么她如何更新自己的信念?在我看来,她不仅需要相信类型,还要相信要遵循的策略。 抱歉,这很愚蠢,但这使我感到困惑。

1
用共同的信念来理解常识(Monderer和Samet,1989)
我试图理解Monderer和Samet 1989年关于近似常识的论文。 我陷入了“同意不同意”定理A的证据的最后部分,其中后验的上界已经建立。下限似乎很清楚,但我无法理解其中一个术语是如何写成的(1-p)。我粘贴了我丢失的部分下面的图片: 建立r_i上限的最后一行对我来说不清楚。任何帮助将不胜感激。该论文的链接是: https://ie.technion.ac.il/~dov/cpb_monderer_samet.pdf (定理A在第180-181页)

0
用于评估解释变量贡献的联盟游戏和Shapley值
我有一个问题,乍一看似乎不是联盟游戏,而是可以描述为具有所有二分变量的逻辑回归:1响应变量Y(我稍后称之为特征/紫星)和5个解释变量A ,B,C,D和E(也是二进制)。 我试图推断出哪些解释变量对Y的贡献最大,并且最好以某种方式定量评估它们的严重程度(比如排序预测变量,变量选择等),并且我发现与Shapley值有很大的相似性。 它与联盟游戏非常相似,因为它具有强大的合作性,但我不确定我是否可以在这种特殊情况下使用它。这种方法的主要问题在最底部用粗体表示。 您能否看看下面的情况,并推荐一些方法,如何使用Shapley值来推断哪种解释以及在多大程度上对响应Y(特征/紫星)的贡献最大。 比方说,我们有五个不同的对象表示为标记的球:A,B,C,D,E创建一些子集和感兴趣的单个特殊特征标记为紫色星。如果星形被填充,则该特征存在于特定集合中,而空心星形表示其不存在。 25−125−12^5 - 12323\frac{2}{3} 我们可以假设(如果需要的话)总是存在至少一个具有该特征的全集实例(例如,标有较厚红包的实例)。 25−125−12^5 - 1 FACEFACEF_{ACE} NACENACEN_{ACE} TACE=FACE+NACETACE=FACE+NACET_{ACE} = F_{ACE} + N_{ACE} TXTXT_XXXXX⊂YX⊂YX \subset YTX≥TYTX≥TYT_X \geq T_Y(A,C,E)⊂(A,B,C,D,E)(A,C,E)⊂(A,B,C,D,E)(A, C, E) \subset (A, B, C, D, E)TACE≥TABCDETACE≥TABCDET_{ACE} \geq T_{ABCDE}。这是因为子集(A,B,C,D,E)的任何实例同时是(A,C,E)的实例,但对于较窄的(A,C,E),我们可以有更多实例。 在本说明书中,我为每个子集类型使用六个实例,因为图片的空间有限,而这六个实例旨在反映具有和缺少该特征的实例之间的总体比例。 25−125−12^5 - 1 FACETACE=56, FBDTBD=16, FABCDETABCDE=46 (the situation of the very first picture)FACETACE=56, FBDTBD=16, …

1
关于子博弈完美均衡的问题
考虑一个包含两个代理X和Y以及两个时间段1和2的完整信息世界。 人X只存在于第二期。 Y人生活在第1和第2期。 X和Y各自赋予外生收入I,可以在两个时期的消费之间分配。 sYsYs_Y = Y的保存和 0≤sY≤I0≤sY≤I0\le s_Y \le I c1Yc1Yc_{1Y} 和分别是代理Y的第一和第二期消耗。c2Yc2Yc_{2Y} A gent X的偏好对于Y来说是无私的。在观察到Y,,X 的保存之后,X确定他的禀赋为转移到Y的sYsYsYtXtXtXtx∈[0,I]tx∈[0,I]t_x\in [0,I] c2Xc2Xc_{2X}代理商X在第2期的消费。 效用函数Y和X分别是 VY=ln(C1Y)+bln(C2Y)VY=ln(C1Y)+bln(C2Y)V_Y= ln(C_{1Y}) + bln(C_{2Y}) VX=ln(C2X)+a∗VYVX=ln(C2X)+a∗VYV_X=ln(C_{2X})+a *V_Y 其中a为正,和a∗b≥1a∗b≥1a*b\ge 1b∈(0,1)b∈(0,1)b\in (0,1) 什么是和的su游戏完美均衡水平?tXtXt_XsYsYs_Y

0
等效文本与梯若尔的博弈论
什么书与蒂罗尔和富登伯格的博弈论相提并论,不包括迈尔森,卡梅尔和西纳沃&amp;弗里德曼?显然,所有这些书都对博弈论采取了不同的观点,无论是正统的还是行为的,但只是想要一些可能的参考书籍,这些书籍具有相似的严谨性。另外,我知道有些人会说Luce&amp; Raiffa或Dresher,但他们已经过时了。

1
游戏中合理化的策略
考虑一种游戏,其中玩家同时选择任何实数x并且玩家2选择任何实数y。收益来自:111xxx222yyy u1(x,y)=2x−x2+2xyu1(x,y)=2x−x2+2xyu_1 (x, y) = 2x − x^2 + 2xy u2(x,y)=10y−2xy−y2.u2(x,y)=10y−2xy−y2.u_2 (x, y) = 10y − 2xy − y^2. (a)根据对方球员的纯策略计算每个球员的最佳反应函数。 (b)查找并报告游戏的纳什均衡。 (c)确定此游戏的合理化策略配置文件。 我得到了前两部分 ∂u1/∂X=0⟹2–2X+2Y=0∂u1/∂X=0⟹2–2X+2Y=0\partial u_1 / \partial X = 0 \implies 2 – 2X + 2Y = 0 ⟹⟹\implies玩家最佳响应1=1+Y1=1+Y1 = 1 + Y ∂u2/∂Y=0⟹10–2Y–2X=0∂u2/∂Y=0⟹10–2Y–2X=0\partial u_2/ \partial Y = 0 \implies …

2
改良凯恩斯选美大赛的纳什均衡
最近我在我们学院的学生中进行了一场小游戏。该游戏基于凯恩斯的选美比赛。参与者必须猜测一个介于0到100之间的数字,而其猜测最接近所有猜测平均值的2/3的参与者将赢得比赛。 不同之处在于:我们还在每一轮比赛中都向获胜者奖励了钱。这笔钱是一个倍数,是最终数字的5倍(平均值的2/3)。 此修改后的游戏的纳什均衡将是什么。解决原始问题的方法当然是每个人都选择0。在上述博弈中,平衡会发生变化吗?考虑n大于30。任何帮助将不胜感激。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.