知识库现在扮演什么角色,将来扮演什么角色?


13

如今,人工智能似乎几乎等于机器学习,尤其是深度学习。有人说深度学习将取代人类专家,在这一领域,人类专家对特征工程非常重要。据说深度学习的兴起有两个突破:一方面是神经科学,另一方面是神经可塑性尤其是告诉我们,就像高度可塑的人脑一样,人工网络可以用于几乎所有功能的建模。另一方面,计算能力的提高,特别是GPU和FPGA的引入,以惊人的方式增强了算法智能,并已使数十年前创建的模型具有强大而通用的功能。我还要补充说,过去几年中积累的大数据(主要是标签数据)也很重要。

这种发展将计算机视觉(和语音识别)带入了一个新时代,但是在自然语言处理和专家系统中,情况似乎并没有太大变化。

实现神经网络的常识似乎是一项艰巨的任务,但是大多数句子,对话和短文本都包含从背景知识中得出的推论。因此,知识图谱对人工智能非常重要。神经网络可用于构建知识库,但似乎神经网络模型难以利用这些构建的知识库。

我的问题是:

  1. 知识库(例如,由Google创造的“知识图”)在AI中是很有前途的分支吗?如果是这样,知识库可以通过哪些方式增强机器学习能力?我们如何将离散的潜在变量合并到NLU和NLG中?

  2. 对于在DL主导的时代中的生存,知识库的方向(或总称符号方法)在哪里?像Wolfram一样的z动态知识库是否是新的方向?还是任何新的方向?

我是否缺少一些基本知识或解决这些问题的想法?


我曾在一家主要销售AI产品的大型IT公司工作。神经网络方法的问题在于每个案例都没有知识库。因此,如果没有任何规则,神经网络就不可能解释“为什么”。训练神经网络,然后制定重复该网络的规则,将为您提供此类答案。但是,现在还没有任何形式的机器学习能够实现这种行为。
MaxW

是的 在我们公司中,仅由NN支持的chitchat机器人非常非常愚蠢。
Lerner Zhang

我找到了这篇论文:arxiv.org/abs/1702.01932
Lerner Zhang

Answers:


4

首先,我想指出知识库和(深度)机器学习之间的主要区别,特别是当主要关注“ AI”而不是“ Data Science”时:

  • NN就像一个黑匣子。即使他们学习了数据集并获得了在问题域上进行泛化的能力,您也永远不会知道他们的工作方式。如果您仔细检查所开发模型的细节,您所看到的只是数字,粗细,不良和牢固的联系以及转换功能。训练阶段之前的“特征提取”步骤从字面上告诉您:“嘿,人类,对于您的复杂世界已经足够,让我们开始零与一”。在DL的情况下,情况更糟!我们甚至看不到选择的有效功能是什么。我不是DL专家,但据我所知,DL的黑匣子更暗!但是知识库是以人类友好的语言编写的。在知识积累阶段之后,您可以看到实体之间的所有联系,更重要的是,您可以解释这些联系。如果您在知识库中剪断电线,您的模型将只失去其一点力量,并且您知道确切会失去什么;例如,断开“ Pluto”节点与“太阳系”节点的连接,将告诉您的模型deGrasse Tyson告诉我们的内容。但是在ML模型中,这可能会变成一个纯粹无用的模型:如果您在用于预测哪些行星属于太阳系的NN模型中操纵14号和47号神经元之间的连接会发生什么?

  • ML模型只是数据的题字。他们没有推论的力量,也没有给你一个。另一方面,知识库可以根据您在问题中指出的先验知识进行推断。结果表明,已经用图像分类数据训练的DL模型也可以应用于语音检测问题。但这并不意味着DL模型可以将其在图像领域的先验知识应用于语音领域。

  • 传统ML算法需要数以千计的数据,而DL算法则需要数以千计的数据。但是数据集的单个实例将为您创建有意义的知识库。

NLP中有两个主要的研究主题:机器翻译和问题解答。实践证明,DL在解决机器翻译问题方面表现出色,但在回答问题时却表现得很愚蠢,尤其是在人机对话涵盖的主题范围很广的情况下。知识库不是机器翻译的好选择,但可能是高尚的答题机的关键。因为在机器翻译中重要的只是文本的翻译版本(而且我不在乎机器到底是如何做到的),但在回答问题方面,我不需要鹦鹉重复我给他的相同信息,但是在我告诉他“苹果是水果”和“


只要不是隐喻的,所有水果都是可食用的,例如“一个人的劳动”。(再说一次,我们可以在隐喻意义上使用“吞噬”,例如当一个吞噬“美味的”堆叠答案并消化其内容时;)
周公爵
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.