跳上潮流说Alpha-Zero的游戏比以前的计算机象棋程序“更具人性”,就像跳上相反的旅行车并说Alpha-Zero的游戏完全是“异形”一样。尚不清楚Alpha-zero的游戏是否“更人性化”,特别是考虑到我们人类倾向于拟人化的趋势。
国际象棋是(人类)思想的斗争
但是在国际象棋中这种趋势是真的吗?马格努斯·卡尔森(Magnus Carlsen)曾经谈到一般的“传统”计算机缺乏人类创造力的说法:
“国际象棋就是人与人之间的斗争。这就是令人兴奋的原因。计算机象棋是机械的,干燥的,平淡的。当然,动作非常强劲,但是没有风格。如果尝试与象棋计算机对战, ,不仅会非常肯定地失去您,而且您会在此过程中感到无聊。
马格努斯·卡尔森(Magnus Carlsen)在传统的象棋计算机中看不到人类玩法的证据。因此,让我们检查一下Alpha-Zero近期的成就是否消除了这种观点并使我们朝着更让我们联想到自己的方向前进。
如果用“类人”的意思是说“表现出更可能吸引我们拟人化的行为”,那么Alpha-zero的风格是否看起来更人性化?我们如何真正测试喜欢投射在非人类事物上的主观近视人类?让我们来问-算法在游戏风格上是“选择性地挑选更好的”还是表现出“更多的人类创造性选择”?
该算法的创建者表明,与使用Alpha-Beta搜索算法的Stockfish不同,Alpha-Zero采用了蒙特卡洛树搜索(MCTS)算法,该算法接受根据先前结果建立的加权参数θ〜第3页。将棋与一般强化学习算法的自玩游戏()。
因此,该算法根本不会表现出选择。它实际上是在进行随机但有概率的Monty-carlo搜索,其中可用的可能搜索路径越来越受以前的结果的影响。Alpha-zero是选择以这种方式优化游戏风格还是程序员的选择?
是Alpha-zero是否总是有所有可能的动作可供考虑,还是某些动作在算法上受到偏颇,从而模仿了人类可以拟人化的体验?
最初,它具有所有可用的动作,因此其“样式”完全是随机的。但是,随着搜索的进行越来越受到先前成功或失败的限制,它的风格实际上正在朝程序员束缚它的方式转变。这是“更人性化”的吗?与此相比,马格努斯·卡莱森(Magnus Carlesen)有时会选择不太理想的举动,因为它们更具创造力:
马格努斯·卡尔森(Magnus Carlsen):“我欣赏创造独特的事物”
国际象棋作为(外来)思想的斗争
人们可以选择决定自己游戏风格的标准(例如,我经常选择自己风格的冲动和错误)。许多人在两次国际象棋中都看到了Alpha-zero的棋局,并且像Alien一样坚定地前进。麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究生Nick Hynes指出:
“我们在这里看到的是一个没有人为偏见和预设的模型:它可以学习它确定的最佳结果,这与我们自己的相同概念相比可能确实更细微。这就像是一个外来文明发明了自己的数学方法,使它可以做诸如时空旅行之类的事情……”
同样,总经理彼得·海涅·尼尔森( Peter Heine Nielsen)告诉Chess.com:
“读了这篇论文之后,尤其是看到了我想的游戏,我一直想知道,如果一个优越的物种降落到地球上,并向我们展示它们如何下棋,那会是什么样。我现在就知道了。”
似乎大多数人对Alpha-zero的新兴游戏风格的反应是“外星人游戏”,而不是“更人性化”。
因此,有理由不同意上面回答“是”的答案。