Questions tagged «lucene»

1
机器学习如何纳入搜索引擎设计中?
我目前正在建立一个基于Apache Lucene的小型内部搜索引擎。它的目的很简单-根据一些关键字,它将建议一些在公司内部撰写的文章。我使用相当标准的TF-IDF评分作为基本指标,并在此基础上建立了自己的评分机制。所有这些似乎都工作得很好,除了一些极端情况下,排名似乎一团糟。 因此,我打算做的是在搜索结果页面上添加一个小的“相关/不相关”链接,以便用户可以根据对结果是否应该首先包含在内的感知,单击其中的一个。 我的点子 将这些相关/不相关视为标签并创建训练数据。 使用此数据来训练分类器(例如SVM) 将此模型整合到搜索引擎中,即,每个新结果都将通过分类器,并为其分配是否相关的标签。 对我来说,这种方法似乎很直观,但是不确定它是否会在实践中起作用。我有两个具体问题: 我应该提取什么所有功能? 有没有更好的方法将机器学习组件集成到搜索引擎中?我的最终目标是基于业务逻辑和用户反馈来“学习”排名功能。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.