我的公司正在寻求为过去11年的客户的Wordpress 2博客帖子创建PivotViewer可视化。但是,为此,我们需要编辑一些杂乱无章,不完整且通常较差的标签,以用作可排序的类别。我正在寻找一种工具,该工具将分析其博客条目并执行字数统计,以使我们对正在处理的内容有所了解。
理想情况下,它将具有所有这些功能:
- 单词黑名单(忽略)
- 词干
- 自定义同义词合并
- 计算所有用途
- 计算单词出现的帖子数。
我本以为这种文本分析是非常普遍的,但是我还没有找到在整个博客上都能做到这一点的软件。有可用的软件来做到这一点吗?