为什么深度神经网络和深度学习不足以实现一般智力?


11

与深度学习(DL)和深度(er)网络相关的所有事物似乎都是“成功的”,至少进展非常迅速,并培养了人们对AGI可以达到的信念。这是流行的想象力。DL是解决许多问题(包括创建AGI)的强大工具。但是,这还不够。工具是必需的成分,但通常不足。

该领域的领先者正在寻求其他方面的进步。本报告/声明收集了Yoshua BengioYann LeCunGeoff Hinton的声明的链接。。该报告还解释了:

DL的主要缺点(如我所见)是:依赖最简单的模型神经元(LeCun称其为“卡通”);使用19世纪统计力学和统计学的思想,这些思想是能量函数和对数似然方法的基础;以及反向支撑和随机梯度下降等技术的结合,导致应用范围非常有限(脱机,主要是分批,有监督的学习),需要高才能的从业人员(又名“随机研究生下降”),且价格昂贵标记的训练数据和计算能力。虽然DL对于可以吸引或购买人才并部署无限资源以收集数据并处理数据的大型公司非常有用,但DL对我们大多数人而言既无用又无用。

尽管有趣且相关,但这种解释并不能真正解决问题的要点:缺少什么?

这个问题似乎很广泛,但可能是由于缺乏简单的答案。有没有办法确定AGI缺少的DL?


Answers:


7

在将系统与类似人类的智能进行比较时,每个与神经网络打交道的人都忽略了一个重要的观点。一个人需要花费数月的时间去做任何可理解的事情,更不用说能够解决成人几乎无法管理的问题了。与我们的神经网络相比,人脑的大小和大小是巨大的。方向可能是正确的,但比例尺远了。人脑中神经元的数量可以按照记忆方式进行匹配,但是无法实时模拟它的并行性(至少对于随机研究者而言)。虽然有些旧,可能会让您了解我们多少缺乏处理能力。


谢谢您的简洁回答。您是说只有DL技术才能达到AGI及以上,才是大小?大小确实很重要,但是可能还缺少一些东西。(本段中的任何一个双关语都是故意的)。
埃里克·普拉

1
例如,让我们将细胞自动机视为Wolfram。非常简单,却导致令人惊讶的复杂性。
埃里克·普拉顿

量子计算(无论最终采用什么形式)是否是该处理问题的建议解决方案之一?
杜克大学(DukeZhou)

量子处理可用于在某一点做出决策,但不能像人类大脑那样用于模拟连续流动。一旦观察到系统,量子波形就会崩溃,从而将其减少到一个缓慢的顺序系统。
Cem Kalyoncu

1
@CemKalyoncu确实。但是一头大象几乎是人类的三倍。当然,大小参数很重要,但仅靠大小似乎还不够。
埃里克·普拉顿

6

深度学习在监督学习中最成功,而大脑大多以无监督的方式建立类别。我们尚不知道该怎么做。(看一下Google Brain:有16,000个核,而这些功能所能做的就是以非常糟糕的准确性识别猫和人脸。)

深度学习使用高度非结构化的激活,即神经网络分类器中“狗”和“猫”的高级表示完全不必相似。另一方面,大脑使用抑制性神经元来创建稀疏的分布式表示形式,这些表示形式可分解为它们的语义方面。这对于类比的抽象和推理可能很重要。

大脑具有许多相互配合的不同部分。深度学习研究人员才刚刚开始整合内存或注意力机制到其架构中。

大脑整合来自许多不同感觉的信息。大多数深度学习应用程序仅使用一种输入类型,例如文本或图片。

大脑能够将序列建模为类别。(基本上每个动词都命名一个顺序(即时间)类别。)然后,可以将这些类别安排到长期分层计划中。到目前为止,我还没有在深度学习中看到任何朝着这个方向发展的东西。

而且,神经网络还无法以与人脑相同的规模运行。如果您看一下这个问题的答案,那么人类的大脑将在未来几十年中在神经元计数方面处于领先地位。一个神经网络可能不需要与大脑相同数量的神经元来达到类似的性能(由于更高的准确性),但是例如现在,视频处理在输入和吞吐量方面仍然非常有限。


这里也很有趣,谢谢。我在这里担心的是,它是对比过程([深度]学习)和(网络或大脑的)结构。如果这种趋势正确,那么AGI就是我们所拥有时间的问题。您确实提到了深度网络中的语义问题,可能最好在对抗模型中查看。这表明缺少某些内容,并且是此答案中最好的论据之一。我确实了解当前的结构还不够(即早期的内存模型)。但是,这间接解决了“为什么”问题。您是否看到改善答案的方法?
埃里克·普拉顿

ML游戏的最新“仅光学”方法是否正在尝试摆脱监督学习?
杜克(DukeZhou)

@DukeZhou:我确实认为RL技术可能在无监督学习中起作用,但是在我看来,现在RL尚未学习高级概念。
BlindKungFuMaster

1
@EricPlaton:我不确定我是否理解您的评论。我认为缺少的是1.结构和2.规模。当然还有算法,但是这些算法与结构相互交织。
BlindKungFuMaster

3

恕我直言,第一个障碍是规模:即使Google最大的DNN也不接近大脑的规模,而且要高出几个数量级...


2

我认为仍然缺少构成人脑的各个方面。有很多不同的网络互相配合

就像冥想通过使大脑更协同地工作来提高认知能力一样,我们也可以将其应用于机器。

例如,谷歌像我们一样,正在学习一台计算机做梦,以加强我们已经学到的东西。 https://medium.com/@tannistho/why-is-google-teaching-its-ai-to-dream-e9ae9ecd0e3a#.gljal6pww

这是路径网,即神经网络的网络。 https://medium.com/@thoszymkowiak/deepmind-just-published-a-mind-blowing-paper-pathnet-f72b1ed38d46#.ed0f6pdq7

创建所有这些机制并以足够的力量将它们放在一起,我们将非常接近!


您能澄清一下“它”是什么吗?这可能是深度学习的过程,也可能是深度网络。这些是不同的。
埃里克·普拉顿

1
两者,但主要是深层神经网络相互配合,我推测DNN也应具有良好的神经可塑性。但这是我们只能触及的基础知识,我们甚至都不知道人脑的工作原理
亚历山大

1

如今,人工智能的支持者关注可计算性问题-可快速解决复杂问题的能力。我相信,在这个方向上取得的任何成功都不会导致人类(一般)智力的发展,尽管在某些领域肯定会胜过人类。相反,应该努力研究哪些神经系统事件引起感觉(Qualia的经验)。当然,这是哲学上的难题,但我相信这是通向智能及其能力的唯一关键。逆向工程和可检验的理论应朝着这一方向发展。


1
Quaila可能是机器拥有的一个有趣特征(尤其是如果我们希望人们授予这些机器的权利),但是除了Quila本身在哲学上是一个非常棘手的问题之外,还有两个主要问题在起作用。(A)智力本身可能不需要魁北克,就可以在没有主观第一人称经历的情况下变得聪明,例如,哲学僵尸。
东南部

(B)工业界只关心快速解决复杂的问题,并不真正担心所说的快速机器是否能思考或感觉到。仅在可以快速解决复杂问题的程度上才需要AGI ...智能只是达到目的的一种手段。(实际上,行业可能不希望使用具有思维和感觉的机器,因为这类机器可能应有权利……而权利有点像法规,限制了企业可以使用其工具进行的操作。)
东南SE在10_6_19
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.