是。这是可行的。
问题概述
通过将一个或多个人工网络与纸牌游戏引擎结合使用,该系统的设计目标似乎已获得了制胜的战略优势。
该问题显示了对游戏基础的普遍认识,正如Morgenstern和von Neuman的博弈论所述。
- 在游戏进行期间的特定时间点,可能需要玩家执行移动。
- 根据游戏规则,有一组最终的移动选项。
- 与其他策略相比,某些选择举动的策略在多个游戏中产生更高的获胜记录。
- 可以使用人工网络来产生比随机移动选择更为频繁地获胜的游戏策略。
游戏玩法的其他功能可能会也可能不会那么明显。
- 在每个移动点都有一个游戏状态,任何参与提高游戏成功度的组件都需要该状态。
- 除了不知道对手什么时候虚张声势之外,在纸牌游戏中,改组纸牌的秘密顺序可以引入虚拟玩家的等价物,其移动近似随机。
- 在三个或更多的玩家游戏中,合作伙伴或潜在合作伙伴的信号可以在任何时候为确定获胜游戏策略增加复杂性。根据编辑,它似乎不会像这款游戏那样复杂。
- 诸如恐吓之类的心理因素也可以在赢得游戏中发挥作用。引擎是否向对手展示面孔是未知的,因此此答案将跳过该答案。
常用方法提示
有一种映射输入和输出的通用方法,但是在Stack Exchange答案中有太多要解释的内容。这些只是一些基本原则。
- 应该可以进行所有可以明确完成的建模。例如,尽管人工网络理论上可以学习如何对卡进行计数(跟踪每个卡的可能位置),但是可以使用简单的计数算法来实现,因此请使用已知算法,并将这些结果作为输入。
- 将与最佳输出相关的任何信息用作输入,但不要将与最佳输出不相关的任何信息用作输入。
- 在训练过程中和自动游戏过程中,对数据进行编码以减少输入向量中的冗余。抽象和概括是实现此目的的两种常用方法。特征提取可以用作抽象或概括的工具。这可以在输入和输出上完成。一个例子是,如果在此游戏中J> 10的方式与A> K,K> Q,Q> J和10> 9的方式相同,则将纸牌编码为2到14或0到12的整数减一。将西装编码为0到3,而不是四个文本字符串。
图像识别工作只是远程相关,与纸牌游戏有很大不同,无法直接使用,除非您需要从视觉图像中识别纸牌,在这种情况下,可能需要LSTM来查看其他玩家为移动选择的内容。学习获胜策略很可能会受益于MLP或RNN设计或其衍生的人工网络设计之一。
人工网络将要做什么以及培训示例
这些类型的人工网络的主要作用是从示例数据中学习功能。如果您具有真实游戏的移动顺序,那么这对于您的项目来说是一笔巨大的财富。其中很大一部分将对培训非常有帮助。
如何安排示例以及是否以及如何对示例进行标记是值得考虑的,但是,如果没有纸牌游戏规则,很难给出任何可靠的方向。是否有合作伙伴,是否基于得分,胜利的举动次数以及其他十二个因素提供了做出这些决策所需的场景参数。
学习了
我可以提供的主要建议是,阅读而不是阅读网络上的常规文章,而是阅读一些您可以了解上述主题的书籍和一些论文。然后找到一些可以下载的代码,并在充分理解术语后尝试尝试下载什么。
这意味着书本搜索和学术搜索比一般的网络搜索更有可能将您引向正确的方向。在一般的网络空间中,有成千上万的装腔作势者,解释了带有大量错误的AI原理。书籍和学术文章出版商对作者的尽职调查要求更高。