我在一组文档上使用了LDA,并发现了一些主题。我的代码的输出是两个包含概率的矩阵。一个doc-topic概率,另一个word-topic概率。但是我实际上不知道如何使用这些结果来预测新文档的主题。我正在使用Gibbs采样。有人知道吗?谢谢
1
“预测新文档的主题”是什么意思?您是否要查找此文档是从哪个主题生成的?您是否要查找文档主题的混合体?您是否要通过单词来源的主题来标记新文档中的每个单词?
—
SheldonCooper
您是否要查找此文档是从哪个主题生成的?您是否要为文档找到主题的混合体?-实际上我想回答这两个问题...但是我的语料库很大,因此每次新文档时我都无法重新训练所有模型检查
—
侯赛因