Questions tagged «game-theory»

博弈论是对两个或多个参与者之间的战略互动情况的研究,其中存在一组预定义的规则以及与每个选择相关的结果。

1
在指数女士与双曲线女士小插图上
我遇到过这个小寓言,旨在说明为什么指数折扣优于双曲线折扣1: [双曲线折扣曲线]的较大弯曲表示,如果双曲线折扣店与使用指数曲线的某人进行贸易,她很快就会省钱。例如,Exponential女士可以在每个春季以便宜的价格购买Hyperbolic女士的冬衣,因为到下一个冬天的距离会使H女士对它的估价比E女士低得多。然后,E女士可以在每个秋天将外套卖回H女士,因为冬天临近,H女士对它的估价高涨。 摘录所涉及的图看起来有点像下面显示的图,最显着的区别是我添加了图例以指示哪条曲线是哪条2以及所使用的实际折现函数的解析形式3。 但是在我看来,如上所述,该论点是虚假的。显然,谁的估值会更低,取决于时间。因此,E女士和H女士的角色完全相同的论点在曲线相交的点和垂直轴之间的任何时间点都适用。 实际上,对于双曲曲线和指数曲线的某些系数选择,对于所有时间点,指数曲线都比双曲线曲线更压抑。例如: 事实证明,上方的绿色指数曲线仅在一个值处与双曲曲线相交。 Ťtt,即 t = 0t=0t = 0(即在垂直轴指示的时间)。对所有人t &lt; 0t&lt;0t < 0,绿色指数曲线严格低于双曲线。 这意味着,如果E女士的指数折扣曲线是绿色的,那么H女士将能够通过应用摘录中所述的策略迅速使她沉迷,并且这与时间间隔之间的时间长度无关冬季大衣的买卖。 总而言之,我认为摘录中关于指数贴现优于双曲线贴现的观点并没有成立。 现在,我意识到摘录并不是特别严格,并且可能有一种更有说服力的方式来证明指数折扣比双曲线折扣的优越性。如果是这样,那是什么?我特别想了解以下内容: 使用指数折扣的人如何单方面使用双曲线折扣的人获得财务优势? (单方面而言,我的意思是该策略仅适用于使用指数折扣而不是使用双曲线折扣的somoneone的人,反之亦然。) 1这段经文中我提到的是乔治·安斯利(George Ainslie)的《意志的破裂》(Break of will)(2001)(第30-31页)。不过我没有这本书。 2根据我对作者“大鞠躬”的意思的解释,我添加了“双曲线”和“指数”标签。我不是英语母语人士,所以如果这种解释是落后的,请纠正我。 3请注意,所有这些功能都具有(- ∞ ,0 ](−∞,0](-\infty, 0]作为他们的领域。为了匹配原始曲线的外观,需要进行此选择。另外,我要强调的是,我为所有这些曲线使用的功能形式是我自己选择的,以便近似原始曲线的外观。摘录的文字未给出所描绘曲线的功能形式。



1
预测博弈论
我正在阅读Fudenberg 撰写的有关整洁博弈的整篇文章http://fudenberg.fas.harvard.edu/predictive%20game%20theory.pdf。他正确地指出,博弈论中的大多数传统工作都不适合在现实世界中进行预测。 您知道有什么工作推动了预测博弈论的理论或经验吗? 我知道一些游戏局部识别的最新工作,但是我对游戏学习和非平衡动态更感兴趣。

1
完美贝叶斯平衡
我遇到了一个正在苦苦挣扎的问题: 以标准的《囚徒困境》游戏为例,该游戏被玩了两次。(玩家在观看第二场比赛之前观察第一场比赛的结果)。考虑关于哪个节点播放器2在其信息集中的信念。 找到弱的完美贝叶斯均衡(策略和信念),其中策略不是子博弈的完美均衡。 因此,在囚徒困境中: (缺陷,缺陷)是唯一的纳什,唯一的子博弈完美均衡也是。 但是,如何获得不涉及缺陷的弱完美贝叶斯平衡呢?当然,这绝对是主导。。。 这个问题错了吗? 然后继续要求顺序均衡(在这里我们考虑混合策略的顺序)。 这个问题是对的还是我误解了这些概念?

1
德布鲁定理的应用/推广
我想知道Debreu的论文“邻近的经济主体”(La Decision 171(1969):85-90)中的最后一个定理;在G. Debreu的《数学经济学:Gerard Debreu的二十篇论文》(1986年),第173页中转载。 -178)已被使用: 定理。 对于拓扑空间MMM 和度量空间 HHH,让 φφ\varphi 是来自的设定值映射 MMM 至 HHH 紧凑的价值(即 φ(e)φ(e)\varphi(e) 每个人都紧凑 e∈Me∈Me \in M)并且连续。此外,对于每个e∈Me∈Me \in M 让 ≲e≲e\lesssim_e是对一个总序,使得所述集合被关闭。然后从到的集值映射其中φ(e)φ(e)\varphi(e){(e,x,y)∈M×H×H:x≲ey}{(e,x,y)∈M×H×H:x≲ey}\{(e, x, y) \in M \times H \times H : x \lesssim_e y\}φ0φ0\varphi^0MMMHHH φ0(e)={z∈φ(e):x≲ez for all x∈φ(e)},e∈M,φ0(e)={z∈φ(e):x≲ez for all x∈φ(e)},e∈M,\varphi^0(e) = \{z \in \varphi(e) : x …

2
常识与红帽之谜
这是一个有助于阐明博弈论常识的难题。三个女孩围成一圈坐着,每个戴着红色或白色的帽子。每个人都可以看到除了自己的帽子以外的所有帽子的颜色。现在假设他们都戴着红色帽子。 据说如果老师宣布至少其中一顶帽子是红色的,然后依次询问每个女孩她是否知道帽子的颜色,则被问到的第三个女孩会知道她的帽子是红色的。我知道那里的原因。第一个必须在其他两个上至少看到一个红色的帽子,说我不知道​​。第二个女孩一定在第三个女孩上看到一个红色的帽子,否则她会推断出第一个女孩在她上看到一个红色的帽子。 我不明白老师的必要性。每个人都知道至少有一个红色的帽子。而且,如果我们从常识开始,他们应该弄清楚其他所有人都知道这一点。那么,如果不以常识为前提,是否仅向老师介绍? 资料来源:http : //cowles.econ.yale.edu/~gean/art/p0882.pdf

2
将纳什均衡扩展到具有无限策略的游戏
在Jehle和Reny的教科书中(我应该补充一点,我只读了几篇有趣的文章,但没有读到很多东西),有一个定理证明了有限的战略形式博弈中总是存在(混合)纳什均衡。该书假定所有参与者都有相同数量的可用动作,但是不难想象,如果不正确,该如何扩展。 但是,我感兴趣的是,是否可以将此扩展到游戏中,尤其是那些可能有无限选择的游戏。例如,在一个游戏中,玩家选择最高的数字获胜时显然没有均衡,但是例如,如果我们有相同的游戏,但是该数字必须在区间内[ 0 ,100 ][0,100][0, 100](或包含其上限的任何间隔),最佳响应函数“收敛”。同样,我也怀疑竞争模型中需要“行为良好”的成本和需求函数才能获得“良好”的结果。 因此,我有两个问题: 是否存在任何定义明确的设置,使得具有无限策略选择的游戏将具有纳什均衡? 相关阅读内容是什么?

2
信息不完善与不完整
有什么不同?为了说明,请举例说明 信息完美但不完整的游戏;和 具有完整但不完美信息的游戏。 相关的。

1
贝叶斯学习者的合并率的统一界限
更新。交叉张贴在交叉验证。 Blackwell&Dubins(1962)在一篇著名的论文中指出,两个贝叶斯代理的后验概率,其先验在度量事件上是一致的 000,随着信息流的增加,彼此之间会变得任意靠近。 数学上,结果如下。让(Ω ,F,{Fñ} ,Q )(Ω,F,{Fn},Q)(\Omega, \mathcal{F}, \{\mathcal{F}_n\}, Q) 是一个经过过滤的概率空间 Fñ↑ FFn↑F\mathcal{F}_n \uparrow \mathcal{F}。让PPP 成为 (Ω ,F)(Ω,F)(\Omega, \mathcal{F}) 与 Q « PQ≪PQ \ll P。然后, d(Pñ,问ñ):=SUP一∈ ˚F| P(一个∣Fñ)- Q (一|Fñ)| → 0 与 Q 一样 n → ∞ 。d(Pn,Qn):=supA∈F|P(A∣Fn)−Q(A∣Fn)|→0 a.s. Q as n→∞.d(P^n, Q^n): = \sup_{A \in \mathcal{F}}|P(A \mid \mathcal{F}_n) …

2
最佳随机出价
这个问题来自我经常浏览的网站。 两名玩家参加了一个热门的新游戏节目,名为“更高人数获胜”。两者进入不同的展位,每个都按下一个按钮,并且屏幕上出现一个介于零和一之间的随机数。(在这一点上,他们都不知道对方的号码,但是他们确实知道这些号码是从标准均匀分布中选择的。)他们可以选择保留该第一个号码,或者再次按下按钮以丢弃第一个号码并获得第二个号码他们必须保留的随机数。然后,他们走出展位,在墙上看到每个玩家的最终号码。慷慨的大奖-一个装满金条的箱子-奖励给保留较高数字的玩家。玩家舍弃第一个数字并选择另一个数字的最佳截止日期是哪个数字?换句话说,他们应该选择在哪个范围内保留第一个数字, 对于对称玩家,这是一个非常奇怪的拍卖问题(我也假设玩家是风险中立的),或者是一个非常奇怪的彩票/游戏理论游戏。 从数学上来讲,您将如何处理这个问题,您会得到什么答案?有没有奖我得到正确的答案,该网站的谜语,我只是好奇。我的直觉告诉我,最佳分界点是0.5,因为您有50-50的机会高于或低于对手的数字,而不管他/她是否拒绝对方的随机数字,但我不确定。


1
信号和筛选中的均衡
我现在正在使用信号和筛选来研究Spence的就业市场模型。 事实证明,当一个工人的保留值= 0(如果她没有被雇用,她可以得到0),那么汇集和分离均衡总是存在于信号中。然而,在筛选中,不存在汇集平衡,并且分离的范围也比信号传导更窄。 为什么会这样?它与直觉标准等改进有什么关系吗? 筛查总是比信号更严格吗? (很抱歉这个问题很简陋 - 这个领域还不太新,也不知道如何轻松地描述问题。) (参考:这个问题在MWG教科书的第13章中讨论过。)

0
供应链是如何形成的?
我试图提出内生供应链形成的理论。一组互补任务需要执行制造一个良好的摹。如果制造,则存在控制市场中商品价格的需求函数d (p G,q G)。在制造商品中涉及的K个任务中,有些是顺序的,有些是并行的(两个互补产品组合成一个)。换句话说,存在描述任务顺序的网络(树)结构。ķKKGGGd(pG,qG)d(pG,qG)d(p_G,q_G)KKK 现在让我们假设市场上有家公司。如果一家公司决定承担一项任务,则会产生一些固定的工厂成本,以及一些可变成本,具体取决于生产的单位数量。然而,如果公司只完成了K任务的一部分,那么就没有好的产品。因此,每家公司的生产决策取决于其财富,预期利润和其他公司的决策。N&gt;KN&gt;KN>KKKK 我的问题:供应链形成是否有类似的理论?我已经阅读了以下几篇接近描述这种形式的论文,但我发现它们与我的想法有很大不同。 奥斯特罗夫斯基,迈克尔。“供应链网络的稳定性。” 美国经济评论(2008):897-923。 Corbett,Charles J.和Uday S. Karmarkar。“具有确定性需求的连续供应链中的竞争和结构。” Management Science 47.7(2001):966-978。 Goyal,Sanjeev和Fernando Vega-Redondo。“社交网络中的结构性漏洞。” Journal of Economic Theory 137.1(2007):460-492。

0
与掠夺性玩家的游戏(参考请求)
我对多人游戏感兴趣,其中一个玩家获得实用性,不仅仅是通过获胜,而是通过看到另一个玩家(提前选择)输掉(或者如果游戏有订单完成则进入最后一个位置)。显然,对于这名球员来说,最好的情况就是获胜并且他的'猎物'会进入最后状态,最糟糕的情况是他最后进入并且他的'猎物'获胜。我想看两个场景。第一种情况是“猎物”不知道它们是目标,第二种情况是他们知道的地方。我已经找了一篇类似风格游戏的论文,但都没有成功。有谁知道这样的游戏是否已被分析过?非常感谢您的帮助。 请注意,这与捕食模型中的零和游戏不同 另外,如果没有相关的工作,你认为这将是一个有趣的分析游戏,它会有任何真实世界的应用程序吗?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.