是否有全文索引引擎之类的东西,可以从命令行查询,并且理想情况下根本不需要使用gui?
我对索引我的电子书和论文特别感兴趣,因此它是pdf,epub和一些djvu的混合物。(开放式)Office文档会很好,但是在我的清单上要低得多。
是否有全文索引引擎之类的东西,可以从命令行查询,并且理想情况下根本不需要使用gui?
我对索引我的电子书和论文特别感兴趣,因此它是pdf,epub和一些djvu的混合物。(开放式)Office文档会很好,但是在我的清单上要低得多。
Answers:
您是否看过Lucene或Sphinx?尽管您将需要首先解析要索引的文档,但是一旦完成,任何人都可以从cli中搜索。
对于Lucene,有一些有关执行此操作的信息。
Sphinx有点模糊,但是也有一些文档可用。您可以通过xmlpipe2数据源将您选择的结构化XML数据传递给sphinx。
Lucene依赖Java,而Sphinx是用C ++构建的,不需要外部依赖。
任何一种都将需要一些工作才能完成您想要的,但是,这似乎是一个完全可行的解决方案。
可以从命令行调用Tracker,并且gtk +不是项目的硬依赖项(但可能是软件包的依赖项)。
代码搜索是一种用于对大型源代码建立索引然后执行正则表达式搜索的工具。
Debian /衍生产品上的超级用户可以尝试: sudo apt-get install codesearch
当前有两种跟踪器,稳定(0.8)和不稳定(0.9)。您的操作系统可能具有0.8版本,因此,如果您能负担得起(它具有一些尖端的软件依赖性),请获取最新的tarfile(0.9.x)。它在0.8之上有很多改进,目前正在进一步稳定以达到0.10(即使数字代表稳定性)。如果选择走这条路线,请使用以下命令进行配置:
./configure --disable-tracker-needle --disable-tracker-preferences --disable-tracker-explorer --disable-tracker-status-icon
您可能不会安装依赖项,因此从发行版中简单地安装0.8并避免使用GUI位应该很容易。在Debian Squeeze,Ubuntu 10.10和Ubuntu 11.04上,它们很好地分开了。因此(以root身份)运行:
apt-get install --no-install-recommends tracker-utils tracker-miner-fs
的CLI工具是tracker-search
,因此可以--help
选择运行它,以查看如何利用它:-)
注意事项:
tracker-applet
和之类的东西tracker-preferences
。但是,它们确实为tracker-search-tool
GUI搜索界面提供了单独的软件包。