Questions tagged «game-theory»

4
为什么要花这么多时间和金钱来建立AI来玩游戏?
我在读有关约翰·麦卡锡(John McCarthy)及其对人工智能的正统见解。在我看来,他似乎并不十分赞成将资源(如时间和金钱)用于使AI玩象棋这样的游戏。相反,他希望更多地专注于通过图灵测试和模仿人类行为的AI。 我还阅读了许多有关大型公司(如IBM,Google等)的文章。他们花费数百万美元制作了AI,以玩国际象棋,围棋等游戏。 这在多大程度上合理?

1
关于在象棋这样的游戏中应用强化学习的一些疑问
我发明了象棋的棋盘游戏。我建立了一个引擎,使其可以自主播放。引擎基本上是决策树。由以下人员组成: 一个搜索功能,可以在每个节点找到所有可能的合法举动 评估功能,可为棋盘位置分配一个数值(正数表示第一个玩家获得优势,负数表示第二个玩家赢得胜利) Alphabeta修剪negamax算法 有关此引擎的主要问题是评估功能的优化确实很棘手。我不知道要考虑哪些因素以及要考虑的权重。我认为改善引擎的唯一方法是,每次因数和权重的不同组合进行尝试时都要迭代游戏。但是,这在计算上似乎是一项艰巨的壮举(我可以不使用深度学习而向后传播吗?)。 我想使用强化学习,通过与自己对战来改善引擎。我一直在阅读有关该主题的文章,但我仍然很困惑。 在游戏中,输赢(1或0)部分还有什么其他奖励?如果我使用其他奖励,例如每次评估函数的输出,该如何实现呢?如何修改评估函数,以在迭代后获得更好的回报?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.