训练聊天机器人的最新方法是什么？

11

我想训练一个使用文本输入，记住一些类别并相应回答问题的机器人。此外，作为2.0版，我还希望使该机器人也能回答语音输入。哪些最新的机器学习/ AI算法可用于相同的？请告诉我。

machine-learning algorithm chat-bots

— 巴拉德瓦伊·奥尔杜尔
source

检查动态内存神经网络

— riemann77 '18

考虑使用对称数学映射。

— 谢尔盖

1

您的问题非常广泛-因此，作为回应，我鼓励您考虑两个广泛的框架：

对于最先进的聊天机器人对话开发，http： //rasa.ai 是一个开源框架，它比更传统的基于规则的系统更具适应性
要进行语音识别，请查看也是开源的https://discourse.mozilla.org/c/deep-speech。

— 朱利安·H
source

0

如果您的漫游器“记住”了几类，然后回答了问题，那么在当前情况下，它是毫无用处的。因为在那种情况下，它在其他数据集（测试集）上的效果非常差。在统计术语中，它称为“过度拟合”。在回答问题时，没有经验法则来定义“最新技术”算法。尽管您可以检查一些在babi或类似数据集上表现良好的模型，例如动态内存网络或seQ2seQ模型。为了获得该领域的基本知识，我建议您学习基本的机器学习术语，然后继续学习一些高级自然语言处理课程（斯坦福大学提供cs224n）。

— riemann77
source

0

阿布沙瓦（AbuShawar）和阿特威尔（Atwell）州：

聊天机器人是一种对话代理，它使用自然语言与用户轮流互动。已经使用语音或文本通信开发了不同的聊天机器人或人机对话系统，并将其应用于不同的领域，例如：语言研究，语言教育，客户服务，网站帮助以及娱乐。

在撰写本文时，他们的论文和其他论文传达了许多现代的聊天机器人培训方法。

从自然对话语料库中自动提取聊天机器人训练数据，Bayan AbuShawar，Eric Atwell，2016年

但是，大多数聊天机器人仅限于其文件中的手动知识以及特定的书面或口头自然语言。本文介绍了我们开发的程序，该程序可以将机器可读的文本（语料库）转换为特定的聊天机器人格式，然后将其用于重新训练聊天机器人并生成更接近人类语言的聊天。使用了不同的语料库：对话语料库，例如英国国家英语语料库（BNC）；伊斯兰古兰经的圣书，这是一个独白的语料库，其中的经节和其后的经节是转折的；以及常见问题解答（FAQ），其中的问题和答案是交替的。此自动化过程的主要目标是能够生成基于语料库的使用不同语言的不同聊天机器人原型。

通过参数化辅助强化学习进行上下文不确定的聊天机器人动作选择，尹传东，张瑞，祁建中，孙宇，谭腾伦，2018

我们提出了一种上下文不确定性聊天机器人和一个强化学习（RL）模型来训练该聊天机器人。所提出的模型称为参数化辅助异步优势参与者评论家（PA4C）。我们利用用户模拟器来模拟对话上下文中用户话语置信度的不确定性。与基于幼稚规则的方法相比，我们的聊天机器人通过PA4C模型进行了训练，避免了手工操作选择，并且对用户话语差异更加健壮。PA4C模型使用操作参数化和用于聊天机器人训练的辅助任务来优化常规RL模型，从而解决了较大的操作空间和零奖励状态的问题。我们通过训练聊天机器人来处理日历事件创建任务来评估PA4C模型。

使用聊天机器人交互进行有监督的学习系统培训，美国专利申请出版物0034828A1，国际商业机器公司，美国纽约州阿蒙克，2019年

一种计算机实现的方法，包括：接收和分析数据点以确定数据点的参数；基于对数据点的分析生成警报票证；通过聊天机器人将警报票证中包含的至少一些信息传达给一个人个或更多用户，并通过聊天机器人将生成警报通知单的数据点归类为生成数据点的设备的行为。乔纳森·A 卡加达斯（Cagadas），亚历山大（Alexander D.Lewitt），西蒙（Simon D.）

利用小型对话语料库实现生成式聊天机器人的两步训练和混合编码-解码，Jintae Kim，Hyeon-Gu Lee，Harksoo Kim，Yeonsoo Lee，Young-Gil Kim，2016年

如果使用巨大的对话语料库作为训练数据，则基于序列到序列网络的生成型聊天机器人模型可以生成自然的对话交互。但是，除了英语和中文之类的几种语言之外，收集大型对话语料库仍然很困难。为了解决这个问题，我们提出了一个聊天机器人模型，使用单词和音节的混合作为编码-解码单元。此外，我们提出了两步训练方法，包括使用大型非对话语料库进行预训练和使用小型对话语料库进行再训练。在我们的实验中，显示了混合单元有助于减少语音不足（OOV）问题。此外，当使用小型对话语料库训练聊天机器人时，两步训练方法可以有效减少响应中的语法和语义错误（533，

基于句子嵌入的次模块化启发式数据选择，用于面向目标的聊天机器人训练，Mladen Dimovski，Claudiu Musat，Vladimir Ilievski，Andreea Hossmann，Michael Baeriswyl，2018

诸如面向目标的聊天机器人或个人助手之类的口语理解（SLU）系统依赖于初始自然语言理解（NLU）模块来确定意图并从用户作为输入的用户查询中提取相关信息。SLU系统通常可以帮助用户解决相对狭窄的领域中的问题，并且需要大量的领域内培训数据。这导致严重的数据可用性问题，从而阻碍了成功系统的开发。为了减轻这个问题，我们提出了一种在低数据状态下进行数据选择的技术，该技术使我们能够以更少的标签句子进行训练，从而降低标签成本。我们提出了一个以次模块化为灵感的数据排名函数，即比率惩罚边际增益，用于仅基于从文本嵌入空间提取的信息来选择要标记的数据点。我们表明，嵌入空间中的距离是可用于数据选择的可行信息来源。我们的方法优于两种已知的主动学习技术，可以对NLU单元进行具有成本效益的培训。此外，我们提出的选择技术不需要在选择步骤之间对模型进行重新训练，从而使时间效率更高。

— 道格拉斯·达西斯科（Douglas Daseeco）
source

-1

您可以使用带有LSTM或GRU的递归神经网络作为存储单元和诸如Word2vec之类的单词嵌入。波束搜索和注意力模型也可以与RNN一起使用，以提高鲁棒性并减少偏差。但是，只有在该领域的研究仍然很热并且有许多问题尚待阐明时，这些研究的输出才在一定程度上是可观的。

— Koushik
source