Questions tagged «nltk»

Natural Language Toolkit是用于计算语言学的Python库。

3
NLTK使用的实际示例
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实,参考或专业知识的支持,但是这个问题可能会引起辩论,争论,民意调查或扩展讨论。如果您认为此问题可以解决并且可以重新提出,请访问帮助中心以获取指导。 8年前关闭。 我在玩自然语言工具包(NLTK)。 它的文档(Book和HOWTO)非常庞大,示例有时会稍作改进。 有没有很好的NLTK用途/应用的基本示例?我正在考虑诸如Stream Hacker博客上的NTLK文章。
77 python  nlp  nltk 

5
使用NLTK删除停用词
我正在尝试通过使用nltk工具包删除停用词来处理用户输入的文本,但是使用停用词删除功能会删除“和”,“或”,“不”之类的词。我希望这些词在停用词删除过程之后出现,因为它们是稍后将文本作为查询处理所必需的运算符。我不知道哪些字符可以作为文本查询中的运算符,我还想从文本中删除不必要的词。
76 python  nlp  nltk  stop-words 

4
SSL错误下载NLTK数据
我正在尝试下载NLTK 3.0以在Mac OS X 10.7.5上与Python 3.6一起使用,但是却遇到SSL错误: import nltk nltk.download() 我使用pip3命令下​​载了NLTK :sudo pip3 install -U nltk。 更改NLTK下载器中的索引可以使下载器显示所有NLTK的文件,但是当一个人尝试下载所有文件时,会出现另一个SSL错误(请参见照片底部): 我对计算机科学比较陌生,对SSL一点也不了解。 我的问题是如何简单地解决这个问题? 这是一个存在相同问题的用户的类似问题: 无法下载nltk数据 我决定发布一个带有屏幕截图的新问题,因为对其他问题的编辑被拒绝了。 我认为没有帮助的类似问题: NLTK下载SSL:证书验证失败 使用nltk.download()下载错误

4
如何从一系列文本输入中提取常用/重要短语
我有一系列文本项-来自MySQL数据库的原始HTML。我想在这些条目中找到最常用的短语(而不是单个最常用的短语,理想情况下,不强制单词对单词的匹配)。 我的示例是Yelp.com上的任何评论,其中以给定餐厅的数百条评论显示了3个摘要,格式为: “尝试汉堡”(共44条评论) 例如,此页面的“评论重点”部分: http://www.yelp.com/biz/sushi-gen-los-angeles/ 我已经安装了NLTK,并且已经对其进行了一些尝试,但是老实说,这些选择让他们不知所措。这似乎是一个相当普遍的问题,我无法通过在此处搜索找到简单的解决方案。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.