分析纸牌游戏《战争》的修改版


13

一个通常由儿童玩的简单游戏,战争游戏由两个人使用标准的52张纸牌玩。最初,牌组被洗牌,所有牌都发给了两个玩家两张,因此每张都有随机顺序的26张随机卡。我们假设允许玩家检查(但不能更改)两个牌组,以便每个玩家都知道两个牌组中的纸牌和纸牌顺序。这通常是在实践中完成的记录,但不会改变游戏的玩法,并有助于使该问题的版本完全确定。

然后,玩家展示各自卡组中最上面的卡。露出较大牌的玩家(按照通常的顺序:2、3、4、5、6、7、8、9、10,Jack,Queen,King和Ace)赢得回合,首先将其牌(高牌),然后是对手牌底部的对手牌(低牌)(通常不执行此顺序,而是为了使该问题的第一个版本保持确定性,例如订单将被强制执行)。

如果出现平局,则每个玩家从其牌组顶部再显示四张额外的牌。如果一个玩家显示的第四张牌高于另一位玩家显示的第四张牌,则具有较高第四张牌的玩家将赢得决胜局中所有已玩过的牌,在这种情况下,获胜者的牌首先被放置在获胜者的牌(按照先进先出的顺序;换句话说,较旧的牌排在最底部),其次是败者的牌(以相同的顺序)。

在随后的平局中,重复此过程,直到确定平局获胜者为止。如果一名玩家用完了纸牌并且无法继续打破平局,则仍然拥有纸牌的玩家被宣布为获胜者。如果两个玩家都用完纸牌同时玩游戏,则该游戏被视为平局。

进行回合,直到一名玩家的纸牌用完(即,他的牌组中没有更多的纸牌),此时仍拥有纸牌的玩家被宣布为获胜者。

到目前为止,已经对游戏进行了描述,因此,确定结果并不涉及技巧和运气。由于有52张牌的排列有一定数量的限制,因此可以有一定数量的初始套牌发行方式,并且随之而来(因为游戏中唯一的状态信息是两个玩家的套牌的当前状态)每个游戏配置的结果都可以事先确定。当然,有可能赢得战争游戏,并且以同样的理由失去它。我们也没有保留战争游戏可能导致并列或无限循环的可能性。对于上述完全确定性版本,可能会或可能不会。

尝试使游戏变得更有趣的几种变体(不,并非全部都涉及将其变成饮酒类游戏)。我想让游戏变得更有趣的一种方法是允许玩家在某些回合中声明自动“王牌”。在每个回合中,任何一个球员(或两个球员)都可以宣布“王牌”。如果一个玩家宣布“王牌”,则该玩家将赢得该回合,而与所玩的牌无关。如果两个玩家都宣布“王牌”,则该回合被视为平局,比赛继续进行。

可以想象有多种规则限制玩家的胜败能力(无限的胜局总会导致并列游戏,因为玩家每回合都会胜出)。我根据这个想法提出了两个版本的战争(就在我脑海中;更有趣的版本是可能的),但使用了不同的王牌限制机制:

  1. k
  2. k

现在,这些问题适用于上述每个版本:

  1. 是否存在一种策略,对于某些可能的初始游戏配置,使用该策略的玩家始终会获胜(强烈获胜策略)?如果是这样,这是什么策略?如果没有,为什么不呢?
  2. 是否有一种策略,对于某些可能的初始游戏配置,使用该策略的玩家始终可以赢得或强制平局(获胜策略)?如果是这样,这是什么策略?如果没有,为什么不呢?
  3. SS

明确地说,我认为“策略”是一种固定算法,它确定使用策略的玩家应该胜过几轮。例如,“只要有可能就干脆”算法是一种策略,也是一种算法(启发式算法)。我要问的另一种方式是:

玩这些游戏是否有任何好的(或证明是最佳的)试探法?

kk=0


还有一个替代版本:如果两个玩家都玩王牌,那么规则是正常的(即最高的纸牌获胜)。
2012年

@乔极好的建议!的确,更广泛地说,不仅可以通过改变玩家获得王牌能力的方式来替代版本,而且可以通过改变在同一回合中两位玩家的王牌处理方式来获得替代版本。也请随时提供您当前情况的分析,因为这样的分析几乎可以肯定会促进对其他类似版本的分析。
Patrick87'3-3-26

Answers:


7

如果我理解正确,则有关这游戏的所有信息都可供两个玩家使用。即,两个玩家都知道起始配置和所有可能的移动(主要是因为两个玩家都可以查看另一个玩家的纸牌)。这使得游戏成为完美信息的零和游戏。因此,存在对两个玩家可用的完美策略,该策略将在每个游戏中为该玩家获得最佳结果。这在1912年被德国数学家恩斯特·策莫洛(Ernst Zermelo)证明。

我不知道该策略是什么,但是可以想象为它构建一棵大游戏树,然后让计算机使用该方法为我找到策略 最小-最大算法

每个游戏的树将以两个玩家的手为根。树中的分支对应于玩家的移动。在最简单的情况下,这些步骤包括简单地放置必需的卡。在更高级的情况下,可以采取“王牌”行动。树的内部节点记录卡的当前配置以及有关状态“王牌”的任何信息。树上的叶子对应于最终游戏位置,例如,对于玩家1获胜,+ 1表示平局;对于玩家2获胜; -1表示对玩家2获胜。现在就忽略循环游戏。

现在,最小-最大算法将按以下方式工作(从玩家1的角度来看)。假设它查看播放器1进行移动的节点,并且下面的节点用+1、0或-1(收益))以及玩家需要做出的选择才能获得给定的结果。玩家1只是选择收益最大的节点,记录收益以及获得收益所需的选择。对于玩家2进行移动的节点,选择收益最小的节点,并记录该选择。这反映出玩家2的目标是赢得最低分。这将传播到树的。每个节点上记录的选择对应于玩家可以做出的最佳策略。最终的收益决定了谁获胜。最终,这是回报的一项功能,尽管具体的举动选择可能会有所不同。

潜在的循环配置只需添加返回到已经看到的配置的循环(从顶部开始计算),就可以将合并到游戏树中。对于此类节点,如果它是播放器1播放的节点,则取最大固定点;而当播放器2播放时,则取最小的固定点。

请注意,如果您没有假设两个玩家都可以检查两个套牌,则此方法将不适用。然后,游戏将涉及机会,并且所选策略将是特定于游戏的。

一个玩家是否有强或弱的获胜策略取决于应用于所有树木的最小-最大算法的结果。但是肯定有很多....因为一个游戏中没有太多选择,所以为一个树计算树可能很容易。


在尝试自己回答这个问题之后,我很快意识到您指出的内容,即必须要有一些最佳策略,但实际上,说明这种策略的规则可能令人难以置信地复杂。在某些版本的游戏中,玩家似乎也可能陷入僵局...两者都能够胜出,但他们不能就应该采用的胜任配置达成共识(如果一个人愿意,那么一个人就胜过了)不会,如果另一个会胜过一个)。很有意思。
Patrick87 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.