11 我有一个内部(内部网)站点,该站点由多个博客和论坛,数百个静态页面,大量PDF文件以及其他几种文档类型组成。在过去的几年中,它被松散地粘在一起,现在是我维护它的工作。 我正在寻找一个可以理想地托管自己的搜索引擎: 如果提供了要搜索的数据库信息和表,则可以直接搜索Blog /论坛数据库。 处理大多数文本文件(PDF / DOC / ODF) 是开源的,或者一旦购买就允许访问源代码 对我而言,它所使用的语言或平台无关紧要。通常,我只会使用Google网站搜索,但这不是Intranet的选择。 search-engines intranet — 蒂姆邮政 source
7 看看Lucene 用Java编写,也可用于.NET框架 这是CodeProject文章,解释了它的工作方式和使用方法。 http://www.codeproject.com/KB/library/IntroducingLucene.aspx — 杰西加文 source
2 基于Lucene的SearchBlox可能能够满足您的需求。它是免费的,并带有一个履带。 — 马特·威尔基 source 25k urls免费,对于Intranet来说不多 — cweiske 2014年 @cweiske查看Ambar,它基于ElasticSearch并且免费。github.com/RD17/ambar — Ilya P
0 通常,我只会使用Google网站搜索,但这不是Intranet的选择。 实际上,存在一个Google Search Appliance,它相当于Intranet的Google网站搜索。但是,这不是开源的(如果您没有注意到,谷歌网站搜索也不是。) 我看着它。我真的很想要可以访问代码的地方。预算部门的工作也有些繁重。 — 蒂姆·波斯特 除了Google Search Appliance之外,“雷石”(Thunderstone)也有类似的产品具有竞争力。我过去都用过。尽管这可能对您不起作用,但我想我会为那些迷惑于此问题的人发布。 — digit1001 2010年