如果这是正确的堆栈站点,则不能确定,但是可以。
.similiarity方法如何工作?
哇,太棒了!它的tfidf模型可能更容易,但是只有一行代码的w2v?
在他的 关于spaCy和 razhribernik的10行教程中,向我们展示了可以在令牌,发送,词块和文档上运行的.similarity方法。
之后nlp = spacy.load('en')
,doc = nlp(raw_text)
我们可以在令牌和块之间进行.likeness查询。但是,此.similarity
方法在后台计算了什么?
SpaCy已经非常简单.vector
,可以根据GloVe模型的训练来计算w2v向量(a .tfidf
或.fasttext
method会有多酷?)。
模型是简单地计算这两个w2v,.vector,向量之间的余弦相似度还是比较其他矩阵?具体细节在文档中不清楚; 任何帮助表示赞赏!
1
“ .tfidf或.fasttext方法有多酷?” 该文档提供了用FastText替换GloVe向量的示例。将它们组合在一起可能并不完全相同。Github
—
卡尔·G