有限状态部分信息博弈的复杂性


12

给定仅具有有限多个状态的确定性部分信息零和博弈,
其可能的结果分别是[loose,draw,win],其值分别为[-1,0,+ 1],
逼近此类值的复杂性是多少?内的附加游戏?ϵ

特别是,我无法提出任何算法来执行此操作。
这篇文章的其余部分完全致力于
对问题进行更彻底的描述 ,因此,如果您已经可以弄清楚
这篇文章顶部的问题 意味着什么,那么就没有理由阅读本篇文章的其余部分。

给定一个裁判机状态,与指定的初始状态,状态 其得分对是的状态其得分对是,其形式为{1,2,3,...,S}s0sa[1,+1]sb[+1,1]

,其中:[p1_info,p2_info,num_of_choices,player_to_move,next_state_table]

  • player_to_move{1,2}
  • 是从一个函数 { 1 2 3 num_of_choices } { 1 2 3 S }next_state_table{1,2,3,...,num_of_choices}{1,2,3,...,S}
  • p1_info,p2_info,num_of_choices1

当机器处于该状态时:

  • 发送到Player_1,然后将p2_info发送 到Player_2,p1_infop2_info
  • num_of_choices{1,2,3,...,num_of_choices}
  • 然后进入指示的状态next_state_table

sasb

  • 暂停该州的得分对作为其输出

s0=1





以下问题的复杂性是什么?
给定这样一个裁判机器和一个正整数N,输出一个有理数,该理数
(累加)在玩家1的自然游戏值的N中。

如本问题前面所述,我无法提出
任何算法来执行此操作。


玩家知道内部结构吗?拥有更多信息的优势是什么,它给出了更多的可能动作?
domotorp 2013年

是。 它使他们对当前状态有了更好的了解。

抱歉,我还是不明白。然后他们知道内部结构,但不知道现在在哪里?请说明清楚,我相信我不是唯一一个不能理解问题的人。
domotorp

3
您的模型是否与“具有部分信息的基于零和回合的随机博弈”相同?
Kristoffer Arnsfelt Hansen 2013年

1
@Kristoffer: (至少对我而言)我的模型不支持编码 非理性概率,尽管我的模型与之等效。

Answers:


6

注意:我声称的算法不正确;我已经把它删了。

pp

对于较低的复杂性约束,近似的值的问题简单随机游戏不知道是P中。使用我在上面给出的随机技巧,可以很容易地将一个简单的随机游戏编写为具有多项式大小的查找表的参考游戏。


这种随机化的想法(至少,正如您所描述的那样)只能给出合理的概率。 另外,您链接的前两篇论文中使用的定义也暗示它们的游戏具有有限的游戏树,而我只需要有限的状态空间(“状态”不包括游戏的历史记录)。

您是对的...我的答案的第一部分是不正确的。让我删除它。我相当确定,即使所有掷硬币的概率均为1/2,也不知道近似简单随机游戏的价值在P中。
Peter Shor

1


ϵ0<ϵ

输入:
如果我的问题中 所述的游戏必须在以下情况下输出YES:玩家1的游戏值大于1-ϵ
ϵ

遗体RE难的,即使

player_to_move始终为1(即仅需要1个玩家),
并且
s 0 ≠s a和s a不在Range(next_state_table)中
(即从字面上看,玩家不可能输掉)

p1_info,p2_info和number_of_choices与状态无关
(即,玩家唯一的反馈就是它是否刚刚获得了胜利)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.