Questions tagged «natural-language-processing»

对于与自然语言处理(NLP)有关的问题,该问题与计算机和人类(或自然)语言之间的交互有关,尤其是如何创建用于处理和分析大量自然语言数据的程序。

3
神经网络如何处理变化的输入大小?
据我所知,神经网络在输入层中具有固定数量的神经元。 如果在类似NLP的上下文中使用神经网络,则大小不同的句子或文本块将被馈送到网络。如何将变化的输入大小与网络输入层的固定大小相协调?换句话说,如何使这种网络具有足够的灵活性以处理可能从一个单词到多页文本的输入? 如果我对输入神经元数量固定的假设是错误的,并且将新的输入神经元添加到网络中或从网络中删除以匹配输入大小,那么我将看不到如何训练它们。 我以NLP为例,但是许多问题本质上是不可预测的输入大小。我对处理此问题的一般方法感兴趣。 对于图像,很明显,您可以将上/下采样到固定大小,但是对于文本,这似乎是不可能的方法,因为添加/删除文本会更改原始输入的含义。

9
机器翻译的实际质量是多少?
直到今天,作为AI外行,我对自动翻译的承诺和改进感到困惑。 我的印象是:还有很长一段路要走。还是有其他解释为什么为什么相当简单的Wikipedia文章的自动翻译(例如由Google提供和提供)仍然读起来和听起来主要是愚蠢的,难以阅读,并且仅在部分程度上有用和有用? 这可能取决于个人喜好(关于可读性,有用性和有用性),但是我的个人期望非常令人失望。 另一方面:Google的翻译对大多数用户而言仍然可读,有用和有用吗? 还是Google有理由保留自己的成就(而不是向用户展示他们可以展示的最好成绩)? 初步结果:我们仍然无法在平等的基础上与人工智能进行对话-仅在字符串级别。那么我们为什么要害怕呢?因为他们知道的比我们知道的还要多 -但是我们不知道吗?

4
是Siri和Cortana AI程序吗?
Siri和Cortana的交流非常像人类。与Google现在主要在被问到一些问题(不设置警报或提醒)时为我们提供搜索结果不同,Siri和Cortana就像人一样向我们提供答案。 那么它们是否是实际的AI程序? (通过“问题”,我不是指任何与学术有关的问题或询问路线/温度,而是基于意见的问题)。


1
知识库现在扮演什么角色,将来扮演什么角色?
如今,人工智能似乎几乎等于机器学习,尤其是深度学习。有人说深度学习将取代人类专家,在这一领域,人类专家对特征工程非常重要。据说深度学习的兴起有两个突破:一方面是神经科学,另一方面是神经可塑性尤其是告诉我们,就像高度可塑的人脑一样,人工网络可以用于几乎所有功能的建模。另一方面,计算能力的提高,特别是GPU和FPGA的引入,以惊人的方式增强了算法智能,并已使数十年前创建的模型具有强大而通用的功能。我还要补充说,过去几年中积累的大数据(主要是标签数据)也很重要。 这种发展将计算机视觉(和语音识别)带入了一个新时代,但是在自然语言处理和专家系统中,情况似乎并没有太大变化。 实现神经网络的常识似乎是一项艰巨的任务,但是大多数句子,对话和短文本都包含从背景知识中得出的推论。因此,知识图谱对人工智能非常重要。神经网络可用于构建知识库,但似乎神经网络模型难以利用这些构建的知识库。 我的问题是: 知识库(例如,由Google创造的“知识图”)在AI中是很有前途的分支吗?如果是这样,知识库可以通过哪些方式增强机器学习能力?我们如何将离散的潜在变量合并到NLU和NLG中? 对于在DL主导的时代中的生存,知识库的方向(或总称符号方法)在哪里?像Wolfram一样的z动态知识库是否是新的方向?还是任何新的方向? 我是否缺少一些基本知识或解决这些问题的想法?

3
如何计算句子之间的结构相似度?
我正在研究一个需要确定两个句子是否相似的问题。我使用BM25算法和wordnet同义词集实现了一种解决方案,用于确定语法和语义相似性。该解决方案运行良好,即使句子中的单词顺序混乱,也可以衡量两个句子是相似的。例如 Python是一门好语言。 语言是一个好的python。 我的问题是确定这两个句子是否相似。 结构相似性的可能解决方案是什么? 我将如何维持句子的结构?

3
机器学习在很大程度上尚未探索哪些拓扑?[关闭]
已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 28天前关闭。 几何与AI 矩阵,多维数据集,层,堆栈和层次结构就是我们可以准确地称为拓扑的东西。在这种情况下,将拓扑视为学习系统的更高级别的几何设计。 随着复杂性的提高,将这些拓扑表示为有向图结构通常很有用。状态图和马尔可夫在博弈论上的工作是经常使用有向图的两个地方。有向图具有顶点(通常显示为封闭形状),并且边缘通常显示为连接形状的箭头。 我们还可以将GAN表示为有向图,其中每个网络的输出以对抗的方式驱动另一个网络的训练。GAN的拓扑结构类似于莫比乌斯带。 我们不能发现新的设计和体系结构,不仅要了解收敛于最佳解决方案或跟踪一个最优解决方案的数学原理,还要了解可以支持这种收敛的网络连接拓扑。这就像先开发处理器,然后在编写操作系统之前先想象一下操作系统需要什么。 为了瞥见我们尚未考虑的拓扑,让我们首先看一下那些拓扑。 第一步-二维拉伸 在1980年代,通过扩展原始感知器设计获得了成功。研究人员增加了第二个维度来创建多层神经网络。通过误差函数梯度的反向传播,通过激活率梯度的反向传播,实现了合理的收敛,该激活函数的梯度因学习率而衰减,并受其他元参数抑制。 第二步-向离散输入信号添加尺寸 我们看到了基于现有手动调整图像卷积技术的卷积网络的出现,这些技术为网络输入引入了尺寸:垂直位置,颜色分量和框架。最后一个维度对于当代电影制作中的CGI,面部替换以及其他形态技术至关重要。没有它,我们将无法生成图像,进行分类和去除噪声。 第三步-网络堆栈 我们看到在1990年代后期出现了许多神经网络,其中一个网络的训练由另一个网络监督。这是概念层的引入,无论是神经元的连续层还是图像中的颜色层。这种类型的分层也不是递归的。它更像自然世界,其中一个结构是另一种完全不同的结构中的器官。 第四步-网络层次结构 我们看到,在2000年代和2010年代初(拉普拉斯等人)进行的研究中,神经网络的层次结构频繁出现,这继续了神经网络之间的相互作用并继续了哺乳动物的大脑类比。现在,我们看到元结构,其中整个网络在表示拓扑的有向图中成为顶点。 第五步%mdash; 从笛卡尔方向出发 非笛卡尔系统重复排列的细胞及其之间的联系已开始出现在文献中。例如,量规等规卷积网络和二十面体CNN(Taco S.Cohen,Maurice Weiler,Berkay Kicanaoglu,Max Welling,2019)研究了基于凸正二十面体的布置。 总结 对于顶点和衰减矩阵,层具有通常价值的激活函数,这些函数映射到相邻层之间的详尽的定向边缘集[1]。图像卷积层通常为二维顶点排列,其衰减立方体映射到相邻层之间的一组定向边的缩减集合[2]。堆栈具有完整的分层网络,作为元有向图中的顶点,这些元顶点按顺序连接,每个边都是训练元参数,增强(实时反馈)信号或某些其他学习控制。网络的层次结构反映了可以聚合多个控件并指导较低级别的学习的概念,或者反映了可以由一个较高级别的主管网络控制多个学习元素的情况。 学习拓扑趋势分析 我们可以分析机器学习架构的趋势。我们有三种拓扑趋势。 因果维度的深度-信号处理的层,其中一层激活的输出通过衰减参数(权重)矩阵馈送到下一层的输入。随着建立更多的控制,仅从反向传播中的基本梯度下降开始,就可以实现更大的深度。 输入信号的维数-从标量输入到超立方体(视频具有水平,垂直,包括透明度和帧的色深-请注意,这与感知器意义上的输入数量不同。 拓扑发展-以上两个本质上都是笛卡尔。尺寸与现有尺寸成直角添加。由于网络以层次结构连接(如拉普拉斯层次结构),莫比乌斯带像圆圈一样(如GAN),因此趋势是地形性的,最好用有向图表示,其中顶点不是神经元,而是较小的网络。 缺少哪些拓扑? 本节扩展标题问题的含义。 有什么理由可以安排多个每个代表神经网络的元顶点,以便多个主管元顶点可以联合起来监督多个员工元顶点? 为什么误差信号的反向传播是负反馈的唯一非线性等效形式? 在代表控件的两个倒数边缘的情况下,不能使用元顶点之间的协作而不是监督? 由于神经网络主要用于学习非线性现象,因此为什么在网络的设计或互连中禁止其他类型的闭合路径? 有什么理由不能将声音添加到图片中以便可以自动对视频片段进行分类?如果是这样,电影剧本是否可以提取电影的特征,并且可以使用对抗性体系结构生成电影剧本并制作电影而无需电影制片厂系统?作为有向图,该拓扑将是什么样? 尽管正交排列的像元可以模拟非正交顶点和边缘的任意规则堆积排列,但是在计算机视觉中,照相机的倾斜度通常为正负90度以外,这样做是否有效? 在以自然语言理解和组装或人工认知为目标的学习系统中,将单个细胞垂直排列在AI系统中的网络中还是将其垂直排列在AI系统中是有效的吗? 笔记 MLP中的人造细胞使用浮点或定点算术传递函数,而不是基于基于幅度和接近度的阈值的电化学脉冲传输。它们不是对神经元的真实模拟,因此将顶点神经元称为这种分析的误称。 图像特征的相关性和紧邻像素之间的相对变化远高于远处像素。

3
人工智能将如何学习语言?
当我意识到我想不出一种可以教授AI的语言时,我就在思考AI及其如何工作。儿童倾向于通过语言和图片与对象的关联来学习语言(例如,人们在狗周围时说“狗”一词,后来意识到人们在说“狗”和“汽车”,并学习“ ”等)。但是,基于文本的AI不能使用这种方法来学习,因为他们将无法访问任何种类的输入设备。 我想出的唯一方法是用英语(或“说话”所要使用的任何一种语言)来编程每个单词和规则,但是这可能需要花费数年的时间。 有没有人对如何做到这一点有任何想法?或者,如果已经完成,如何做? 顺便说一句,在这种情况下,我正在使用AI来表示具有近乎人类智能且没有先验语言知识的人工智能系统。

5
是否已经开发出任何可以故意欺骗/欺骗人类的AI系统?
当今的AI系统是功能强大的机器,最近,自然语言处理和响应领域以及AI机器的基本算法结构都在不断创新。 我想问的是,鉴于这些最新的突破,是否开发出了能够(最好以某种程度的成功)向人类撒谎的人工智能系统(已知具有某种事实)? 请注意,我要问的内容超出了图灵测试的规范讨论范围。我问的机器可以“理解”事实,然后根据这个事实制定一个谎言,也许利用其他事实来产生可信的“掩盖”作为谎言的一部分。 EG:CIA超级计算机被间谍偷走了,他们试图用计算机来做事,但是计算机一直在说它丢失了依赖项,尽管它实际上不是,或者是故意提供看起来正确但错误的答案。或给人错误的位置,知道该人常去某个地方,但此刻不在。当然,不必这么复杂。

2
有人还在使用概念依赖理论吗?
Roger Schank在1970年代利用概念依赖(CD)在语言处理方面做了一些有趣的工作。然后,他有些移出了领域,如今正在接受教育。在自然语言生成(BABEL),故事生成(TAILSPIN)和其他领域中有一些有用的应用程序,通常涉及计划和情节而不是单个句子。 是否还有其他人继续使用CD或其变体?除了Hovy的PAULINE(使用CD表示要生成的故事)以外,我没有其他项目可以使用。

1
有没有人尝试训练AI学习所有语言?
似乎大多数项目都试图教AI学习各种特定语言。 在我看来,跨语言的书面和口头单词与词组之间存在关系-在学习第二语言后,大多数使用者会更容易地学习更多的语言,并且我们开始理解不同语言中的单词与词组之间的关系。 有没有人尝试训练AI学习所有语言? 这是否比尝试向AI教授一种具有特定语言的所有特定细节的单一语言更容易解决?既然您实际上从培训集中省略了许多其他语言的相关数据?

1
可以生成程序的AI
我一直在研究Viv开发中的人工智能代理。根据我的理解,该AI可以生成新代码并根据用户查询执行它。我很想知道的是,这种AI如何学习基于某些查询生成代码。此过程涉及哪种机器学习算法?我考虑的一件事是逐步分解程序的数据集。例如: 代码平均取5个学期 1-将所有5个项加在一起 2-除以5 然后,我将训练一种将文本转换为代码的算法。据我所知。但是还没有尝试任何东西,因为我不确定从哪里开始。有人对如何实现Viv有任何想法吗?这是Viv的演示。

4
可以使用一组语法规则来概括英语吗?
在编程语言中,存在一组语法规则,它们控制有效的语句和表达式的构造。这些规则有助于解析用户编写的程序。 在功能上是否存在完整的语法规则集,可以准确地解析英语(特定于语言环境)的任何语句,并且可以在基于AI的项目中实现? 我知道在线上有很多NLP工具包,但是效果不那么理想。他们中的大多数人都是使用特定的语料库训练的,这些语料库有时无法推断出表达式各个部分之间的某些复杂关联。 换句话说,我要问的是,一台计算机是否可以解析一个熟练的英语句子,好像它是由一个成年的讲英语的人解析的一样? 编辑:如果不能使用简单的语法规则来表示它,可以使用哪种语义结构来概括它? 编辑2:本文证明自然语言中没有上下文无关性。我正在寻找解决方案,即使它太复杂。

2
是否有任何类似于Winograd SHRDLU的现代NLP实现?
我遇到了Winograd SHRDLU程序,我发现它非常有趣且令人向往。 对此有什么共识?有没有类似的尝试? 我正在阅读Terry Winograd 了解自然语言的书,他在其中讨论程序的功能,LISP语言等。我还发现了语言学家Michael Halliday和Winograd的书中提到的语言理论系统(功能)语法。 是否还有其他AI / NLP使用此理论作为语义功能的基础? https://zh.wikipedia.org/wiki/SHRDLU

1
人工智能可以制作一种构造的(自然的)语言吗?
“一种人造的或人工构造的语言(有时被称为共轭语言)是一种由个人或小团体创造的语言,而不是自然地作为一种文化的一部分而形成的。” (资料来源:简体中文维基百科) 我的问题是,人工智能可以通过单词,词缀和语法规则来构造自己的自然语言吗?基本上,人类可以使用这种语言互相交流。(最好是传达抽象的高级概念。) 这样的人工智能可以使用哪些技术?它可以基于现有的自然语言还是与现有的自然语言联系很少?它是否可以设计一种比现有语言(甚至世界语)更易于学习的语言?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.