Questions tagged «similarity»


22
变长字符串的一种更好的相似度排序算法
我正在寻找一种字符串相似性算法,该算法在可变长度字符串上比通常建议的字符串(levenshtein距离,soundex等)产生更好的结果。 例如, 给定字符串A:“ Robert”, 然后字符串B:“艾米·罗伯逊” 会比这更好 字符串C:“理查德” 同样,最好该算法应该是语言不可知的(也可以使用英语以外的其他语言)。

4
如何评估OpenCV的两个图像有多相似?
OpenCV是否支持比较两个图像,并返回一些值(可能是百分比)来指示这些图像的相似程度?例如,如果同一张图像通过两次,将返回100%;如果图像完全不同,则将返回0%。 我已经在StackOverflow上阅读了很多类似的主题。我也做了一些谷歌搜索。可悲的是,我无法给出令人满意的答案。

6
给定2个句子字符串,计算余弦相似度
从Python:tf-idf-cosine:查找文档相似度,可以使用tf-idf余弦计算文档相似度。如果不导入外部库,是否有任何方法可以计算2个字符串之间的余弦相似度? s1 = "This is a foo bar sentence ." s2 = "This sentence is similar to a foo bar sentence ." s3 = "What is this string ? Totally not related to the other two lines ." cosine_sim(s1, s2) # Should give high cosine similarity cosine_sim(s1, s3) # Shouldn't …

3
如何找到相似的结果并按相似性排序?
如何查询相似度排序的记录? 例如。搜索“库存溢出”将返回 堆栈溢出 SharePoint溢出 数学溢出 政治溢出 视觉特效溢出 例如。搜索“ LO”将返回: 巴勃罗毕加索 米开朗基罗 杰克逊·波洛克 我需要什么帮助: 使用搜索引擎索引和搜索MySQL表,以获得更好的结果 使用Sphinx搜索引擎和PHP 在PHP中使用Lucene引擎 使用全文索引,查找相似/包含的字符串 什么不好 Levenshtein的距离非常不稳定。(UDF,Query) 搜索“ dog”给我: 狗 沼泽 前 大 回声 LIKE 返回更好的结果,但是长查询没有返回任何结果,尽管确实存在类似的字符串 狗 狗狗 多加拉尔 教条
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.