Answers:
以过度简化为代价,潜在特征是“隐藏”特征,以将它们与观察到的特征区分开。潜在特征是使用矩阵分解从观察到的特征中计算出来的。一个示例是文本文档分析。从文档中提取的“单词”是特征。如果将单词的数据分解,则可以找到“主题”,其中“主题”是一组具有语义相关性的单词。低秩矩阵分解将数行(观察到的特征)映射到较小的一组行(潜在特征)。详细地说,该文档可能已观察到诸如“风船,大篷车,游艇,轮船,巡洋舰”之类的特征(单词),它们会“分解”为“船”和“船”之类的潜在特征(主题)。
[风船,大篷车,游艇,轮船,巡洋舰,...]-> [船,船]
潜在的想法是,潜在特征是观察者特征在语义上相关的“集合”。当您具有大规模,高维且嘈杂的观察到的要素时,将分类器构建在潜在要素上是很有意义的。
当然,这是为了阐明该概念的简化描述。您可以阅读有关潜在狄利克雷分配(LDA)或概率潜在语义分析(pLSA)模型的详细信息,以获取准确的描述。
(MxN)
M
N
然后,通过引入K
“潜在因子”,可以对矩阵进行“分解”,这样(MxK)
就不会有一个矩阵,而是有两个矩阵:-对于用户,和(KxN)
-对于项目,其矩阵乘法会生成原始矩阵。
最后,您的问题是:矩阵分解的潜在特征是什么?它们是K
用户口味和推荐项中未知的特征(),因此当这两个矩阵相乘时,它们会生成已知推荐的矩阵。特殊权重(用户对特定功能的偏好和特定项目中功能的数量)通过所谓的交替最小二乘算法定义,有关更多信息,请参见此处
在我看来,潜在特征是一个术语,用于描述按实体的结构(即按其包含的特征(特征)而不是它们所属的类)对实体进行分类的标准。这里的“潜在”一词的含义很可能类似于社会科学中的含义,其中非常流行的术语“潜在变量”(http://en.wikipedia.org/wiki/Latent_variable)表示不可观察的变量(概念)。
以下论文的“简介”部分很好地解释了潜在特征的含义以及在社会科学现象建模中的用途:http : //papers.nips.cc/paper/3846-nonparametric-latent-feature-models-for-链接prediction.pdf。