Questions tagged «architecture»

2
在任何任务上,模块化神经网络是否都比大型整体网络更有效?
模块化/多个神经网络(MNN)围绕训练较小的独立网络而形成,它们可以相互馈入或与另一个较高的网络交流。 原则上,分层组织可以使我们理解更复杂的问题空间并获得更高的功能,但是似乎很难找到过去就此进行的具体研究的示例。我找到了一些资料: https://zh.wikipedia.org/wiki/Modular_neural_network https://www.teco.edu/~albrecht/neuro/html/node32.html https://vtechworks.lib.vt.edu/bitstream/handle/10919/27998/etd.pdf?sequence=1&isAllowed=y 我有几个具体问题: 最近有没有关于使用MNN的研究? MNN表现出比大型单个网络更好的性能吗? MNN是否可以用于多模式分类,即在根本不同的数据类型(文本还是图像)上训练每个网络,并转发到对所有输出进行操作的高级中介? 从软件工程的角度来看,这些不是在分布式系统上更具容错性且易于隔离吗? 是否使用神经结构搜索之类的方法来动态调整子网的拓扑结构? 通常,MNN是否以任何方式实用? 道歉,如果这些问题看起来很幼稚,我只是从生物学/神经科学背景进入ML,甚至更广泛地进入CS,并被潜在的相互作用所吸引。 非常感谢您抽出宝贵的时间为您提供见解!

1
为什么AlphaGo Zero的合并神经网络比两个独立的神经网络效率更高?
与以前的版本相比,AlphaGo Zero包含了多项改进。在这份备忘单中可以看到Alpha Go Zero的建筑细节。 这些改进之一是使用单个神经网络,该神经网络可以同时计算移动概率和状态值,而旧版本则使用两个单独的神经网络。根据论文表明,合并的神经网络效率更高: 它使用一个神经网络,而不是两个。早期版本的AlphaGo使用“策略网络”来选择下一个动作,并使用“价值网络”来从每个位置预测游戏的获胜者。这些都结合在AlphaGo Zero中,可以对其进行更有效的培训和评估。 对我来说,这似乎很不直观,因为从软件设计的角度来看,这违反了关注点原则上的分离。这就是为什么我想知道为什么合并被证明是有益的。 这种技术-将不同的任务合并到单个神经网络中以提高效率-是否可以总体上应用于其他神经网络,还是需要某些条件才能起作用?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.