Questions tagged «lucene»

Lucene一词指的是开源Java全文搜索引擎库,也指围绕它发展的整个生态系统,包括lucene.net,solr,elasticsearch和zend-search-lucene。

12
Solr对比ElasticSearch [关闭]
已关闭。这个问题是基于观点的。它当前不接受答案。 想改善这个问题吗?更新问题,以便通过编辑此帖子以事实和引用的形式回答。 去年关闭。 这些技术之间的核心架构差异是什么? 另外,哪种用例通常更适合每种用例?

9
ElasticSearch,Sphinx,Lucene,Solr,Xapian。哪种适合哪种用法?[关闭]
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实,参考或专业知识的支持,但是这个问题可能会引起辩论,争论,民意调查或扩展讨论。如果您认为此问题可以解决并且可以重新提出,请访问帮助中心以获取指导。 7年前关闭。 我目前正在寻找其他搜索方法,而不是拥有庞大的SQL查询。我最近看过Elasticsearch,并玩过whoosh(搜索引擎的Python实现)。 您能给出选择理由吗?

8
全文搜索引擎的比较-Lucene,Sphinx,Postgresql,MySQL?
我正在建立Django网站,并且正在寻找搜索引擎。 一些候选人: Lucene / Lucene与指南针/ Solr 狮身人面像 Postgresql内置全文本搜索 MySQl内置全文本搜索 选择标准: 结果相关性和排名 搜索和索引速度 易于使用,易于与Django集成 资源需求-网站将托管在VPS上,因此理想情况下,搜索引擎不需要大量的RAM和CPU 可扩展性 其他功能,例如“您的意思是?”,相关搜索等 任何对以上搜索引擎或其他不在列表中的引擎有经验的人-我很想听听您的意见。 编辑:至于索引需求,随着用户不断向站点输入数据,这些数据将需要连续索引。它不一定是实时的,但是理想情况下新数据将以不超过15-30分钟的延迟显示在索引中

10
NoSQL(MongoDB)vs Lucene(或Solr)作为数据库
随着基于文档数据库的NoSQL运动不断发展,我最近研究了MongoDB。我已经注意到与Lucene(和Solr的用户)一样,如何将项目视为“文档”也有惊人的相似之处。 所以,问题是:为什么要在Lucene(或Solr)上使用NoSQL(MongoDB,Cassandra,CouchDB等)作为“数据库”? 我在寻找答案时(我确信其他人正在寻找)是对它们的一些深入比较。让我们一起跳过关系数据库的讨论,因为它们有不同的用途。 Lucene具有一些重要的优点,例如强大的搜索和权重系统。更不用说Solr中的方面了(是的,Solr即将集成到Lucene中,是的!)。您可以使用Lucene文档来存储ID,并像访问MongoDB一样访问文档。将其与Solr混合使用,您现在可以获得基于WebService的负载平衡解决方案。 在谈论类似的数据存储和MongoDB的可伸缩性时,您甚至可以对诸如Velocity或MemCached之类的进程外缓存提供程序进行比较。 关于MongoDB的限制使我想起使用MemCached,但是我可以使用Microsoft的Velocity,并且对MongoDB具有更多的分组和列表收集功能(我认为)。没有比在内存中缓存数据更快或可扩展的方法。甚至Lucene都有一个内存提供程序。 MongoDB(和其他)确实具有一些优势,例如易于使用它们的API。新建一个文档,创建一个ID,然后存储它。做完了 好,易于。

5
选择独立的全文本搜索服务器:Sphinx还是SOLR?[关闭]
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案会得到事实,参考或专业知识的支持,但是这个问题可能会引起辩论,争论,民意测验或进一步的讨论。如果您认为此问题可以解决并且可以重新提出,请访问帮助中心以获取指导。 8年前关闭。 我正在寻找具有以下属性的独立全文搜索服务器: 必须作为独立服务器运行,可以处理来自多个客户端的搜索请求 必须能够通过对SQL查询的结果建立索引来进行“批量索引”:说“ SELECT id,text_to_index FROM document;” 必须是免费软件,并且必须在以MySQL作为数据库的Linux上运行 必须快速(排除MySQL的内部全文搜索) 我发现具有这些属性的替代方法是: Solr(基于Lucene) ElasticSearch(也基于Lucene) 狮身人面像 我的问题: 他们如何比较? 我有没有其他选择吗? 我知道,每个用例是不同的,但是否有某些情况下,我肯定不希望使用某个软件包?

7
Solr和Lucene的区别
我知道Lucene和Solr是两个可以一起工作的Apache项目,但是我不明白每个项目的目的是什么。 我到目前为止所了解的是,Lucene用于创建搜索索引,而Solr使用该索引执行搜索。我是对的还是这是完全不同的方法?
163 java  solr  lucene 


7
如何查询SOLR空字段?
我的Solr索引很大,并且我注意到某些字段没有正确更新(索引是动态的)。 这导致某些字段具有空的“ id”字段。 我已经尝试过这些查询,但是它们没有用: id:'' id:NULL id:null id:"" id: id:['' TO *] 有没有一种查询空字段的方法? 谢谢
112 solr  lucene 

8
Elasticsearch与Cassandra对比Elasticsearch与Cassandra
我正在学习NoSQL,并正在为客户的需求之一寻找不同的选择。在提出这个问题之前,我已经遍历了各种资源(对NoSQL不太了解的人) 我需要以更快的速度存储数据并读取数据。 完全故障安全且易于扩展。 能够搜索数据以获取Google Analytics(分析)。 最后我列出了以下内容: Cassandra and Elasticsearch 我所了解的是,Cassandra对我来说是一个完美的NoSQL存储解决方案,因为我可以使用索引写入数据和读取数据。它失败或可能失败的地方在Analytics(分析)上。将来,如果我想从中获取数据from_date to to_date,或者想以更多方式获取数据进行分析,那么如果我没有正确设计数据模型或保持长期的眼光,那么在不断变化的世界中,这可能会很难。 While Elastic Search最擅长建立索引(由Lucene支持),并且可以通过抛出一些随机文本来随机搜索数据。但是,即使我要检索数据,它是否也一样工作from_date to to_date(我希望是这样)。但是真正的问题是,它是搜索引擎还是像Cassandra这样的完美NoSQL数据存储?如果是,为什么我们仍然需要Cassandra? 如果两者都在不同的世界,请解释一下!我们如何结合它们以获得更有效的解决方案?

2
Lucene分析仪的比较
有人可以解释一下Lucene中不同分析仪之间的区别吗?我遇到了maxClauseCount异常,并且我知道可以通过使用KeywordAnalyzer避免这种情况,但是我不想在不了解分析器相关问题的情况下从StandardAnalyzer进行更改。非常感谢。
104 lucene  analyzer 

4
lucene如何索引文件?
我读了一些有关Lucene的文件。我也通过此链接(http://lucene.sourceforge.net/talks/pisa)阅读了文档。 我不太了解Lucene如何为文档建立索引,也不了解Lucene用于索引的算法是什么? 在上面的链接上,它说Lucene使用此算法建立索引: 增量算法: 维护一堆细分指数 为每个传入文档创建索引 将新索引推入堆栈 令b = 10为合并因子;M = 8 for (size = 1; size < M; size *= b) { if (there are b indexes with size docs on top of the stack) { pop them off the stack; merge them into a single index; push the …

4
Lucene如何工作
我想了解Lucene搜索如何如此快速地工作。我在网络上找不到任何有用的文档。如果您有什么需要阅读(缺少Lucene源代码),请告诉我。 在我的情况下,使用带有索引的mysql5文本搜索的文本搜索查询大约需要18分钟。lucene搜索同一查询只需不到一秒钟的时间。
90 lucene 

7
在solr查询中使用OR和NOT
我正在研究类似于以下内容的Solr查询: ((myField:superneat AND myOtherField:somethingElse) OR NOT myField:superneat) 运行此命令时,不会返回任何结果。在“或非”两边使用条件会返回我期望的结果-它们不能很好地协同工作。在myField匹配superneat的情况下,我还打算确保将myOtherField设置为somethingElse,但是如果myField不是superneat,请将其包括在结果中。 有人可以解释为什么solr不返回这种查询的结果吗?应该以某种方式重组查询吗?或者有其他方法可以使用solr获得所需的结果吗?
83 search  lucene  solr 

4
如何从Lucene TokenStream获取令牌?
我正在尝试使用Apache Lucene进行令牌化,但我对从中获取令牌的过程感到困惑TokenStream。 最糟糕的部分是我正在查看JavaDocs中解决我的问题的注释。 http://lucene.apache.org/java/3_0_1/api/core/org/apache/lucene/analysis/TokenStream.html#incrementToken%28%29 不知何故,AttributeSource应该使用an而不是Tokens。我完全不知所措。 谁能解释如何从TokenStream获得类似令牌的信息?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.