AlphaZero是AGI的一个例子吗?


11

根据DeepMind 在arxiv.org上的研究论文

在本文中,我们将类似但完全通用的算法(称为AlphaZero)应用于国际象棋和将棋以及围棋游戏,除了游戏规则外,没有任何其他领域知识,这证明了通用强化学习该算法可以在许多具有挑战性的领域中实现超人性能。

这是否意味着AlphaZero是AGI(人工通用情报)的一个例子?

Answers:


11

好问题!

  • AlphaZero虽然是一个重要的里程碑,但绝对不是 AGI :)

AlphaGo虽然在围棋游戏中表现出色,但在狭义上很强(“窄窄AI”),定义为单个问题或问题类型(例如围棋和其他非机会性完美信息游戏)中的实力。

  • AGI至少在人类解决或解决的所有问题上必须与人类一样强大。

AGI通常与智能相关,智能被定义为超越人类水平的智能。

从某种意义上讲,AGI不一定意味着超级智能,因为我们认为一个android可以执行所有人类活动,并且具有与人类相同的能力,就像人工通用智能

但是从技术上讲,AlphaGo是一种狭义的超级智能,因为它在一个问题上超过了人类的所有性能。


没有狭narrow的超级智能。我们称其为弱AI :)。没有人能在一生中找到Microsoft Word或Excel的半最佳编译-而现代机器可能会在几个小时内完成。
Quonux

我怀疑@Quonux取决于定义。Bostrom对超级智能的定义大致类似于“人工智能”,但从词源上讲,该术语本身仅表示“更高的智能”,实际上是“高于+智能”。在此基本定义下,“强窄AI”可能与“窄超智能”同义,因为“强”的原始定义是AGI,因此在AlphaGo之后,学者们开始使用“窄”限定词。
周公克

@Quonux在这里我要说的一部分是,随着AlphaGo的出现,在单个任务中超过人类能力的AI的“弱”一词似乎已被“窄窄的AI”所取代。
周四

2

可能不正确的假设

本文的语调中有两个假设可以识别。

  • 所有智力挑战都可以简化为具有固定规则的游戏。
  • 比人类更好的机器是人类真正想要或需要的。

问题中还有另外两个可识别的地方。

  • 人类中存在着一般智力1
  • 如果它存在于人类中,则在计算机中是可行的。

所有四个可能都是正确的,但四个都不是确定的。

AlphaZero的生产率

如果我们的棋盘在壁橱的游戏架上,我们的草很长,并且割草机坏了,那么如果AlphaZero连接到人形机器人,则不会为任务序列编码游戏规则。

  • 听其所有者的要求,
  • 学习如何操纵机器人
  • 找到并确定我们所有的工具和备件,
  • 固定割草机,以及
  • 让我们知道割草机已经可以使用了。

因此,在这种情况下,它对我们没有特殊的消费者价值。不太一般。

即使它可以用已经运转的割草机修剪草坪,它也很有价值,它不需要赢得任何东西的能力,而是具有服从并展现出不会在花坛上奔跑所需的超人智慧的能力。

DeepMind的聪明人选择使用拉丁文的tabus rasa而不是空白板,这一点是值得注意的,但是却不及构建一个学习程序能令人印象深刻,该程序可以学习仅以编码规则和实际游戏玩法为输入的三款游戏。

要考虑这些游戏程序在产品领域中真正有用,就不能依靠持续的兴趣购买每次打败购买者的软件。为了使AI产品切实可行,学习功能必须具有俗称的常识能力,这需要比游戏固定规则更广泛和灵活的领域知识。我们可以猜测,大多数在赢得游戏学习方面取得里程碑式成就的研究人员正在朝着这个方向努力。他们也知道他们的研究成果必须最终被生产出来,或者促成可购买的SaaS产品。

如果可以将这些进展重定向到数据中心空间中,以产生可治愈癌症或疱疹或逆转糖尿病或阿尔茨海默氏症的补救性基因疗法,那么对于该领域以外的人来说将是令人印象深刻的。然后,我们可以原谅研究人员没有为我们提供下载文件,该文件可能伪装成一个机器人来清洁我们的浴室。从该论文尚不清楚AlphaZero是否已充分证明其具有“在许多挑战性领域中的超人性能”。

他们所做的工作仍然令人印象深刻,并且在其他方​​面也取得了进展。我们中很少有人敢尝试发明一种游戏,这些通用游戏学习程序无法快速学习并在几个游戏实例中击败我们。

透视中的进步

当然,在执行算术,分拣邮件以及现在进行游戏时,人性化的发明扩展了赤裸裸人类的能力,而没有他的工具。这一进步将计算机系统牢牢地置于工具的范围之内。反铲在某种程度上也是超人的。尝试铺设一公里不接的管道。

相反,人类扮演着计算机保健提供者的角色。如果他们生病或失败,我们将被迫驱逐他们的病毒和蠕虫或更换其故障部件。否则我们的房屋和企业陷入混乱。

如同所有事物一样,技术应该被透视。

明智的做法是,让人们减少对游戏的迷恋和互相殴打,而将注意力更多地集中在旨在通过其新发明的工具解决社会和经济问题的协作社会行为上,而这样做的方式不会产生新的问题或不会引起邀请。新的暴行。


脚注

根据相反的证据,在人类中存在被描述为通用情报的说法是有争议的。许多人会引用这些策略和趋势作为限制人类智能的证据。

  • 核威慑作为和平战略
  • 有限,关键的自然能源消耗完全缺乏节制
  • 全球成瘾模式的密度不断增加
  • 造成地球第六次大灭绝

感谢您的编辑,这样更好(至少对我来说),更多地关注答案的技术部分。关于AGI需要达到多么合理或高性能的问题可能存在另一个问题。同样,我们希望人类遵循什么样的个人或团体行为标准,尽管除非该问题专门针对与人工智能的比较,否则这不是本网站的标准。
尼尔·斯莱特
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.