Questions tagged «alphago-zero»

1
为什么AlphaGo Zero的合并神经网络比两个独立的神经网络效率更高?
与以前的版本相比,AlphaGo Zero包含了多项改进。在这份备忘单中可以看到Alpha Go Zero的建筑细节。 这些改进之一是使用单个神经网络,该神经网络可以同时计算移动概率和状态值,而旧版本则使用两个单独的神经网络。根据论文表明,合并的神经网络效率更高: 它使用一个神经网络,而不是两个。早期版本的AlphaGo使用“策略网络”来选择下一个动作,并使用“价值网络”来从每个位置预测游戏的获胜者。这些都结合在AlphaGo Zero中,可以对其进行更有效的培训和评估。 对我来说,这似乎很不直观,因为从软件设计的角度来看,这违反了关注点原则上的分离。这就是为什么我想知道为什么合并被证明是有益的。 这种技术-将不同的任务合并到单个神经网络中以提高效率-是否可以总体上应用于其他神经网络,还是需要某些条件才能起作用?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.