Questions tagged «gt.game-theory»

与计算机科学和博弈论有关的理论问题

5
有证据证明PPAD很难吗?
人们经常引用哲学上的理由来证明即使没有证据也认为P!= NP。其他复杂性类别有证据表明它们是不同的,因为如果没有,则将产生“令人惊讶”的结果(例如多项式层次结构的崩溃)。 我的问题是,相信PPAD类难治的依据是什么?如果存在用于找到纳什均衡的多项式时间算法,这是否暗示其他复杂性类的问题?是否有一个试探性的理由说明为什么应该很难?

1
具有不相关半私人硬币的推荐游戏
我一直(现在仍然)对这个问题的答案很感兴趣,因为这是关于游戏复杂性的有趣变化,尚未解决,因此我提供了赏金。我认为最初的问题很可能太难了,所以我发表了三个相关的问题,这些问题也值得悬赏。在赏金到期之前,没有人发布任何答案。后来我能够回答两个相关的问题(问题3和4,在我的原始帖子下面讨论),表明用相关的半私人硬币(定义如下)近似参考游戏的价值是EXPTIME完全的。原始问题仍然没有答案。我也对将PSPACE和EXPTIME之间的相关游戏放入有趣的复杂度类中的任何结果感兴趣。 原始帖子: 这个问题的灵感来自对伊泰的十六进制问题的讨论。推荐游戏是这样的游戏,其中两个计算不受限制的玩家通过可翻转私人硬币的多项式时间验证程序进行通信来玩(因此,回合数和通信量也受到多项式时间的限制)。比赛结束时,裁判在P中运行算法以确定谁获胜。确定谁赢得了这场比赛(甚至是大约)是EXPTIME完成的。如果您有公共硬币和公共通讯,这些游戏都在PSPACE中。(请参见Feige和Killian,“简化游戏”。)我的问题涉及这两个结果之间的界限。 问题:假设您有两个玩多项式长度游戏的计算无界玩家。裁判的角色仅限于在每次移动之前为每个球员提供一定数量的私人掷硬币(与其他球员无关)。玩家的所有举动都是公开的,因此被对手看到-唯一的私人信息是掷硬币。在游戏结束时,将显示所有私人掷硬币情况,而专职裁判使用这些掷硬币情况和玩家的举动来决定谁获胜。 根据参考的游戏结果,近似第一个玩家获胜的概率是在EXPTIME中,而且显然也是PSPACE难题。是哪个(如果有)?关于这个问题有什么了解吗? 请注意,玩家可能必须使用混合策略,因为您可以通过这种方式玩零和矩阵游戏(la von Neumann)。 附加材料: 让我们称此复杂类RGUSP(所有语言如上所述,其可以减少到一个审阅游戏用不相关半私有硬币,使得如果X ∈ 大号,播放器1胜概率≥ 2 / 3,并且如果X ∉ 大号,播放器1胜概率≤ 1 / 3)。我的三个相关问题是:LLLx∈Lx∈Lx \in L≥2/3≥2/3\geq 2/3x∉Lx∉Lx \notin L≤1/3≤1/3\leq 1/3 问题2:RGUSP似乎相当强大。例如,如果我们改变游戏规则,则裁判不发送消息,而是仅观察玩家1和2的公开消息,并从中接收私人消息,则近似此游戏的价值仍然等同于RGUSP。我想证明RGUSP是稳健的,所以我愿意给赏金的人谁找到一个自然复杂的C类,这样PSPACE Ç ⊆ RGUSP,那里既没有安全壳似乎是准确的。⊆⊆\subseteq⊆⊆\subseteq 问题3:我也强烈怀疑RGCSP类(具有相关半私人硬币的推荐游戏)是否已经完成EXPTIME,并且我也愿意将赏金给予证明这一事实的人。在RGCSP中,第一步是裁判为两个参与者提供相关的随机变量(例如,他可能会给第一个参与者一个较大的投影平面上的一个点,第二个参与者为包含该点的线)。此后,对于多项式回合,两个玩家交替发送彼此多尺寸的公共消息。比赛开始后,多时裁判决定谁赢了。估算玩家1的获胜概率有何复杂性? 问题4:最后,我有一个问题可能与密码和概率分布有关:是否可以在不相关的半私有硬币的裁判游戏中向两名玩家进行遗忘转移,是否可以让他们玩相关硬币的任意裁判游戏(或者,是否可以让他们玩游戏,确定赢家是EXPTIME完整的)?

3
TQBF的这种变体是否仍是PSPACE完整的?
确定是否有一个量化的布尔公式,例如 ∀ X1个∃ X2∀ X3⋯ ∃ Xñφ (x1个,X2,… ,xñ),∀X1个∃X2∀X3⋯∃Xñφ(X1个,X2,…,Xñ),\forall x_1 \exists x_2 \forall x_3\cdots \exists x_n \varphi(x_1, x_2,\ldots , x_n), 始终评估为true是经典的PSPACE完全问题。这可以看作是两个玩家之间交替进行的游戏。第一个玩家决定奇数变量的真值,第二个玩家决定偶数变量的真值。第一个玩家尝试将 false,第二个玩家尝试将其设置为true。决定谁拥有制胜法宝是PSPACE-complete。φφ\varphi 我正在考虑两个参与者的相似问题,一个试图使布尔公式φφ\varphi真,而另一个试图使它为假。区别在于,在一次移动中,玩家可以为其选择一个变量和一个真值(例如,在第一步移动中,玩家可能会决定将X8X8x_8设置为true,然后在下一步中,第二个玩家可能会选择决定将X3X3x_3设置为false)。这意味着玩家可以决定要分配真值的变量(尚未分配真值的变量),而不必按照X1个,… ,xñX1个,…,Xñx_1 , \ldots , x_n的顺序进行游戏。 给该问题一个 关于n个变量的布尔公式φφ\varphi,以决定玩家一(试图使它为假)或玩家二(试图使它为真)是否有获胜策略。由于游戏树具有线性深度,因此这个问题显然仍然存在于PSPACE中。ññn 它是否保持PSPACE完整?

4
社会选择,箭头定理和开放性问题?
最近几个月,我开始就社交选择,箭头定理和相关结果进行自我介绍。 在阅读了开创性的结果之后,我问自己关于偏序偏好会发生什么,答案在Pini 等人的论文中。:汇总部分有序的偏好:不可能和可能性结果。然后,我想知道是否有可能找到可接受的社会选择功能的特征。然后又有人做了(满足 Mossel和Tamuz 的Arrow定理条件的函数的完全刻画)。我不会提供完整的清单,但是我能想到的是与社会选择有关的任何问题,在过去五年中所有这些问题都得到了解决:( 那么,您知道是否存在关于该领域最近完成的工作以及未完成哪些工作的调查? 另一个问题是:您是否了解复杂性和与社交选择相关的问题(例如,查找与至少一个社交选择功能或此类问题兼容的最大用户子集的复杂性)。

4
排列游戏redux
这是对先前问题的重述。 考虑以下两个爱丽丝和鲍勃之间公正, 完美的信息游戏。给玩家一个从1到n的整数的排列。在每个回合中,如果当前排列增加,则当前玩家输掉,另一玩家赢。否则,当前玩家删除其中一个号码,然后将游戏传递给另一位玩家。爱丽丝先打。例如: (1,2,3,4)-根据定义,鲍勃立即获胜。 (4,3,2,1)-不管别人怎么玩,爱丽丝在三回合后获胜。 (2,4,1,3)-鲍勃可以在第一回合获胜,无论爱丽丝如何比赛。 (1,3,2,4)-爱丽丝立即通过移除2或3获胜;否则,Bob可以通过删除2或3来赢得第一轮胜利。 (1,4,3,2)-爱丽丝在第一回合拿下1 最终胜出;否则,Bob可以在不移除1的情况下赢得第一轮胜利。 是否存在多项式时间算法来确定假设完美玩法的情况下哪个玩家从给定的起始排列中赢得这场比赛?更笼统地说,因为这是标准的公正博弈,所以每个排列都有Sprague-Grundy值;例如(1,2,4,3)的值为* 1,而(1,3,2)的值为* 2。计算此值有多难? 尽管可以通过动态编程将其减少为时间,但显而易见的回溯算法以O(n!)时间运行。O (2ñp Ò 升ÿ(n ))O(2npoly(n))O(2^n poly(n))

1
利用博弈论选择研究课题
这个最近的博弈论问题让我思考(当然是切线):是否有可能有效地优化个人策略,以选择研究问题以运用博弈论进行研究? 为了使问题正式化,我将作以下(非正式陈述的)假设: 我同样“喜欢”我可以解决的任何特定问题(以避免“做自己喜欢的事情”的“软”(正确)答案)。 对于我选择要解决的任何给定问题,我可能会成功,也可能不会成功。对于任何给定的问题,我都会估算出解决问题的能力(在投入时间之后)的概率。 我的目标是在进行线下评估(申请工作,申请终身任职,申请研究金等)时,最大程度地提高我的回报,这取决于我解决了多少个问题以及这些问题的重要性或难易程度。我不清楚每个问题的确切收益,但我可以做出合理的估算。 问题收益与问题难度之间存在松散的逆关系。我的目标的另一种说法是“博弈”差异(即寻找“低落的果实”)。 这个整体问题的一个实例由一系列研究问题(可能是无限个)指定,我将其牢固地附加(不计任何计算成本;作为输入给出)对问题价值和问题难度的估计。我正在与对手(评估我的人)进行游戏;考虑到我解决给定问题的可能性,自然决定了在选择尝试后是否能够成功解决问题。 为了真正形式化正在发生的事情(避开无趣的或争论性的/讨论式的回应),我将把这个问题看作是一种形式广泛的游戏,其中包含不完整的信息以及无限的动作集。 问题:我认为这类游戏无法有效计算。但是,是否有多项式时间算法可以使我的收益最大化?PTAS呢? 或者,是否存在针对此问题的更准确的博弈论模型?如果是这样,则存在相同的问题:我可以(大约)有效地最大化收益吗?如果是这样,怎么办?

2
黑手党有多难?
《黑手党》是聚会上流行的角色扮演游戏,有关详细说明,请访问Wikipedia http://en.wikipedia.org/wiki/Mafia_%28game%29。 基本上,它的工作方式如下: 最初,玩家中的每一个都被暗中分配了一个角色,与黑手党或城镇保持一致。每个角色可能都有特殊的能力;稍后再讨论。ñNN 游戏分为两个阶段:白天和黑夜。在晚上,黑手党可以彼此秘密交流;他们可能会同意当晚他们谋杀的一名目标球员。在Day,所有(活跃的)玩家都在一个开放的论坛中进行交流。玩家可能同意私下一名玩家,因此绝对需要所有玩家的绝大部分。 如果仅剩黑手党或仅剩城镇,则游戏结束。幸存党获胜。 让我们假设有三个角色:Citizen,Investigator和Mafioso。公民没有权力。黑手党成员除了晚上能够互相交流并每晚可以为一名谋杀受害者投票外,也无能为力。调查人员可以在每晚的晚上调查另一位玩家,以了解他们的确切角色。 假设游戏开始于一天,并且玩家的角色在死亡时就被揭示 取胜策略 给定一个设置的我调查,Ç公民,米黑手党,我们说的设置是赢得了镇,如果有一个城市的玩家的策略,这样他们就赢,无论怎样的黑手党扮演。(i,c,m)(i,c,m)(i,c,m)iiicccmmm 请注意,我们可以假设黑手党发挥了全面的作用,因为我们想考虑他们可以做出的任何决定。 例如:该设置赢得了镇。(4,1,1)(4,1,1)(4,1,1) 第1天:所有城镇玩家如实报告自己在公开聊天中的角色。黑手党玩家必须声称自己是调查员或公民。 如果他声称拥有公民身份,那么黑手党人就是两名被指控的公民之一。每个调查员可以调查其中一个,然后找出真实的一个。最多只有一名调查员可以在夜间死亡,而其他两名则只是将黑手党吊死。 因此,黑手党组织必须要求调查员。有5名涉嫌调查者。在公开聊天中,调查人员同意进行排列以相互检查。 晚上1:调查人员检查目标,黑手党杀害了目标。 第2天:还剩下3名调查员。所有据称的调查人员均报告其调查结果。无论谁被杀,至少还有一个被另一位活着的调查员证实。由于黑手党声称是调查员,因此他还需要说明他指定的目标是否是黑手党。如果他陷害某人,则该镇知道他或被陷害的一个人是黑手党,与另一个已确认的3镇相对。如果他不框框任何人,则还将有3个已确认的城镇。无论哪种方式,都不要将任何人吊死,并调查剩下的仅有的两名嫌疑人赢得了Town。 问题 决定给定设置是否接受Town的获胜策略有多难?从直觉上讲,这听起来像是一个问题。有人可以提出减少的建议吗?PSPACEPSPACEPSPACE 我们可以找到最少的制胜法宝吗?就像我们可以最小化或(i + c ):m的比率吗?我:m一世:米i:m(i + c ):米(一世+C):米(i+c):m

1
粗相关均衡和相关均衡之间的分离
我正在寻找证明无政府状态价格的技术示例,这些技术具有将粗略相关均衡(无外部后悔动力学的极限集)上的无政府价格与相关均衡(下限上的无政府状态)价格分开的能力。无交换遗憾的动态集)。这种类型的天然分离物是否已知? 区分这两个类别的一个障碍是,证明无政府状态代价的最自然(也是最常见的)方法是仅观察到处于平衡状态时,没有玩家有任何动机偏离其在OPT上的表现,并以某种方式使用它将某种形式的社会福利与OPT的社会福利联系起来。不幸的是,任何关于无政府状态的价格在粗略相关均衡上的证明都很小,仅考虑每个参与者对单个替代行动(比如来自OPT的行动)的偏离也必然对相关均衡成立,因此无法提供分离。这是因为粗略相关均衡和相关均衡之间的唯一区别是相关均衡中的参与者同时考虑的能力多次偏离,取决于他从平衡分布得出的比赛概况信号。 这样的分离已知吗?

3
算法进化博弈论的来源
我在很宽泛的意义上使用标题术语。 关于进化博弈论,包括其数学基础,有大量工作要做。我被推荐为《进化游戏与人口动态》,但尚未深入研究。 关于算法博弈论的工作也很多,这是该网站上的热门话题。 我想看到的是有关某些进化动力学的计算复杂性或收敛性声明的工作。 示例(措辞非常宽松): 给定一个种群和一个进化方案,我们能否为长期种群的最优性(相对于产生的最佳个体)给出概率后悔?这似乎与专家团队和匪徒问题密切相关。在非平稳环境中呢? 给定一组在环境中相互作用的不同物种的种群,几乎可以玩任何类型的多人游戏,鉴于他们的进化策略,我们可以对其策略或策略分布的最终稳定性做出什么陈述。 在具有许多“小生境”的一种环境中(据我所知,这是一种过分的措辞方式),无论是与环境的直接关系还是与其他物种的关系,我们都可以对种群如何分布做出什么陈述?这些利基。 我没有问过但应该问的任何问题-我来这里的时候几乎没有AGT,TCS,遗传算法,进化博弈论或种群生物学背景;我从优化/机器学习/统计的角度问我的问题,这可能是错误的或不完整的。

1
纳什均衡的计算有界形式?
我想知道纳什均衡概念是否有计算上的局限性,类似于以下内容。 想象一下一种在板上玩的两人完美信息游戏,在最佳玩法很难EXPEX的意义上,它是复杂的。为了简单起见,也假设不可能绘制。想象一下一对(A ,B )随机多项式时间Turing机器彼此对战。对于每个n,令p A ,B(n )为A在n次博弈中击败B的概率。(具体来说,假设An×nn×nn\times n(A,B)(A,B)(A, B)nnnpA,B(n)pA,B(n)p_{A,B}(n)AAABBBnnnAAA首先以概率0.5进行比赛。)我认为很酷的是,如果可以证明一对具有以下特性:没有随机多项式时间图灵机A '支配A(其中“ A '占主导地位甲 “是指p 甲',乙(ñ )&gt; p 甲,乙(ñ )对于所有足够大ñ),并且类似地没有随机多项式时间图灵机乙'(A,B)(A,B)(A,B)A′A′A' AAAA′A′A'AAApA′,B(n)&gt;pA,B(n)pA′,B(n)&gt;pA,B(n)p_{A',B}(n) > p_{A,B}(n)nnnB′B′B'占主导地位(其中,“ 乙“支配乙 ”的意思p 甲,乙'(Ñ )&lt; p 甲,乙(Ñ )对于所有足够大Ñ)。BBBB′B′B'BBBpA,B′(n)&lt;pA,B(n)pA,B′(n)&lt;pA,B(n)p_{A,B'}(n) < p_{A,B}(n)nnn 不知何故,我怀疑这实在是太希望了,但是对于像这样的受限游戏来说,这样的事情真的有希望吗? 这个问题的动机是,我正在寻找一种方式来规范给定棋位置“对怀特有利”的观念。传统上,一个职位对怀特来说是胜利,或者不是。但是,无论是人还是计算机的国际象棋选手都对怀特拥有优势的含义有直观的了解。鉴于玩家在计算上受限制并且必须猜测最佳移动,这似乎与怀特获胜的可能性有关。对于特定对随机算法当然谈论白赢,但我想知道是,如果有可能,在一定意义上,一个概率的一个CAN 规范 一对具有计算边界的玩家,其获胜概率产生的位置值仅取决于游戏本身,而不取决于玩家的特质。

3
白象礼品交换:公平分工的机制
北美节日派对上最受欢迎的游戏是白象礼物交换。简而言之(忽略变化),其工作方式如下: 有个人和n个包装好的礼物。玩家被任意下令。在我个回合,玩家我要么ññnññn一世日一世日i^{\text{th}}一世一世i 选择包装好的礼物并将其拆开作为礼物 “窃取”已经打开的礼物之一(从某个玩家)。ķ &lt; 我ķ&lt;一世k < i 如果玩家的礼物被盗,他们现在有机会做同样的事情。当玩家选择包裹好的礼物时,回合结束。 尽管系统中存在许多变化,但需要注意的一点是,最后一名玩家具有不公平的优势,因为只有他们才能保证自己选择任何未包装礼物的能力。 这属于与不可分割的商品有关的公平划分方法(不同于切蛋糕)。 我的问题是: 是否存在分配公平礼物的机制(因为每个玩家都有相同的机会选择他们认为有价值的高价值礼物)? 请注意,由于商品是不可分割的,因此我们在公平的定义上将需要一些灵活性,并且我们不会为玩家引入金钱补偿。

2
(算法)博弈论中的突出猜想和未解决的问题?
什么样的猜想和主要的开放性问题在算法博弈论(或与CS有关的一般博弈论)中最重要?例如,在解决之前,我认为NASH的决议是完全PPAD的决议。 (补充:解决PPAD与P和NP的关系是一个很好的开放问题,但是在计算复杂度上不那么根深蒂固的其他问题也是不错的。)

7
博弈论在计算机科学中的应用?
作为一名计算机科学专业的学生,​​我被介绍了博弈论,但并未对此主题有太多了解。我在Google上搜索过,看了一些有关博弈论的书,他们证实了它在计算机科学中的用途。我已经从经济学家的角度开始了对博弈论的正式研究。现在,我想知道博弈论在计算机科学中的应用。利用博弈论要素的人工智能和复杂性理论等领域的计算机科学家最近有哪些主要成就?有没有一种方法可以比计算机经济学更深植于计算机科学中?

2
定位重叠圆以最大化它们之间的传播时间的游戏
我遇到了以下游戏。我将根据要求进行迁移。 一个小虫正在拜访圈子,而对手则希望最大限度地利用他的旅行时间。 对手每转一个圈。 错误从当前位置直接移到最新圆的中心,然后在遇到圆的内部时停止(因此:如果播放覆盖其位置的圆,则错误不会移动)。轮到这个bug了。 对手有圈子。NNN 每个后续圆的半径均小于先前的圆。 每个圆圈必须与所有先前玩过的圆圈的交点相交。也就是说,所有圈玩完后必须有一个公共的相交点。 编辑:对手可以自由选择圆的半径,但要受半径单调减小的约束。 问题与解答: 的距离是否有界?N→∞N→∞N\to\infty答:不,此答案给出了一个对抗策略的示例 错误代码在圈子中必须经过的最大距离是多少。NNN答:通过相同的答案,它以增长。Θ(log(N))Θ(log⁡(N))\Theta(\log(N)) 变体2:该虫子直接向最近玩过的两个圆圈的交点走去。 更新:解决了该变体,其前提是该错误只能记住在此播放的最后两个圆圈。结果再次是无限的距离。 无限制的记忆有什么影响?也就是说,错误发生在所有先前玩过的圆圈的交点上。这产生了的“松散”边界,其中d是第一个圆的直径。显然不能少于这个。看这里。当前的上限为1000 × d。这是通过将最坏情况的路径近似为围绕逐渐变小的圆的游历而获得的。结果表明,虫子总是朝着最终的交叉口前进,从而减小了它必须行进的下一步距离。O(d)O(d)O(d)ddd1000×d1000×d1000\times d 我怀疑行进的距离是第一个圆的周长的常数倍,但是我目前无法提供一个很好的证明。

3
几个图表上的游戏
考虑在某个节点上带有芯片的有向加权图上的以下游戏。GGG 所有节点都用A或B标记。GGG 有两名球员爱丽丝和鲍勃。爱丽丝(Bob)的目标是将芯片移至以A(B)标记的节点。 最初,爱丽丝和鲍勃分别拥有和美元。mAmAm_AmBmBm_B 如果玩家处于失败位置(即筹码的当前位置用相反的字母标记),他或她可以将筹码移至相邻节点。这种移动要花费一些美元(相应边缘的重量)。 如果玩家处于失败位置并且没有钱来修复它,则该玩家会失败。 现在考虑由一元表示形式给出的,由所有有向加权图(所有权重均为正整数),筹码的初始位置以及Alice和Bob的大写字母组成的语言GAME。GGG 这样爱丽丝在这场比赛中就有了制胜法宝。 该语言游戏属于P。确实,游戏的当前位置由筹码的位置以及Alice和Bob的当前资本来定义,因此动态编程起作用(在此,以一元表示形式给出初始资本很重要)。 现在考虑该游戏的以下概括。考虑几个有向加权图,每个图上都有一个码片。所有图形的所有节点都由A和B标记。现在,如果所有筹码都由B标记,则Bob获胜;如果至少一个筹码由A标记,则Alice获胜。G1,…GnG1,…GnG_1, \ldots G_n 考虑由所有图形,初始位置和大写字母和(以一元表示形式)组成的MULTI-GAME语言,以便爱丽丝在相应的游戏中获胜。在这里重要的是,所有图形都必须有大写字母,因此,不仅仅是几个独立的GAME。G1,…,GnG1,…,GnG_1, \ldots, G_nmAmAm_AmBmBm_B 问题 MULTI-GAMES语言的复杂性是什么?(这是否也属于P,还是有一些原因使这个问题很难解决?) UPD1 Neal Young建议使用Conway的理论。但是,我不知道有可能将这种理论用于具有共同资本的几种游戏。 我要显示UPD2的示例,该示例表明MULTI-GAME并不是很简单。让爱丽丝将其资本为项(她将在第个图形上使用美元)。将定义为最小值,这样在第个游戏中,如果Alice和Bob 分别拥有和美元,则Bob获胜。如果(对于某些),则爱丽丝获胜。但是,事实并非如此。考虑下图的两个副本(最初,芯片在左上方A): mAmAm_Annn米一个= 一个1个+ 一个2+ … 一个ñmA=a1+a2+…anm_A = a_1 + a_2 + \ldots a_n一个一世aia_i一世iib一世bib_i一世ii一个一世aia_ib一世bib_ib1个+ … bñ&gt; 米乙b1+…bn&gt;mBb_1 + \ldots b_n > m_B米一个= 一个1个+ 一个2+ … 一个ñmA=a1+a2+…anm_A = a_1 + a_2 …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.