潜在功能的含义?


24

我正在学习推荐系统的矩阵分解,并且看到该词latent features出现得太频繁了,但我无法理解它的含义。我知道功能是什么,但我不了解潜在功能的概念。请解释一下吗?或者至少将我指向可以阅读的论文/地方?


潜在变量使模型可以建模的功能更加强大。取决于数据和算法来定义其值。换句话说,潜在变量就像“步骤”,它弥合了您所观察到的变量与所需预测之间的差距。此“间隙”越宽,潜在变量越有用。
Vladislavs Dovgalecs 2015年

Answers:


25

以过度简化为代价,潜在特征是“隐藏”特征,以将它们与观察到的特征区分开。潜在特征是使用矩阵分解从观察到的特征中计算出来的。一个示例是文本文档分析。从文档中提取的“单词”是特征。如果将单词的数据分解,则可以找到“主题”,其中“主题”是一组具有语义相关性的单词。低秩矩阵分解将数行(观察到的特征)映射到较小的一组行(潜在特征)。详细地说,该文档可能已观察到诸如“风船,大篷车,游艇,轮船,巡洋舰”之类的特征(单词),它们会“分解”为“船”和“船”之类的潜在特征(主题)。

[风船,大篷车,游艇,轮船,巡洋舰,...]-> [船,船]

潜在的想法是,潜在特征是观察者特征在语义上相关的“集合”。当您具有大规模,高维且嘈杂的观察到的要素时,将分类器构建在潜在要素上是很有意义的。

当然,这是为了阐明该概念的简化描述。您可以阅读有关潜在狄利克雷分配(LDA)或概率潜在语义分析(pLSA)模型的详细信息,以获取准确的描述。


“潜在特征是使用矩阵分解从观察到的特征中计算出来的。” 使用矩阵分解进行的计算是否是将潜在量视为潜在量的必要条件?
flow2k

5

(MxN)MNxij

然后,通过引入K“潜在因子”,可以对矩阵进行“分解”,这样(MxK)就不会有一个矩阵,而是有两个矩阵:-对于用户,和(KxN)-对于项目,其矩阵乘法会生成原始矩阵。

最后,您的问题是:矩阵分解的潜在特征是什么?它们是K用户口味和推荐项中未知的特征(),因此当这两个矩阵相乘时,它们会生成已知推荐的矩阵。特殊权重(用户对特定功能的偏好和特定项目中功能的数量)通过所谓的交替最小二乘算法定义,有关更多信息,请参见此处


3

在我看来,潜在特征是一个术语,用于描述按实体的结构(即按其包含的特征(特征)而不是它们所属的对实体进行分类的标准。这里的“潜在”一词的含义很可能类似于社会科学中的含义,其中非常流行的术语“潜在变量”(http://en.wikipedia.org/wiki/Latent_variable)表示不可观察的变量(概念)。

以下论文的“简介”部分很好地解释了潜在特征的含义以及在社会科学现象建模中的用途:http : //papers.nips.cc/paper/3846-nonparametric-latent-feature-models-for-链接prediction.pdf


我阅读了您引用的论文中的介绍,但是发现它对理解潜在功能的概念没有太大帮助。
威尔

@Will随意建议来源,并提供更好的解释。
Aleksandr Blekh '17


@会谢谢你。我同意-这是一个很好的介绍/解释(不过,我敢肯定还有很多其他好的介绍/解释)。
Aleksandr Blekh '17

1

再举一个例子,考虑用户使用电影分级矩阵(例如Netflix设置)的情况。这将是一个庞大的稀疏矩阵,难以处理。

请注意,每个用户都有特定的偏好,例如科幻电影或浪漫电影等。因此,除了存储所有电影分级之外,我们还可以存储单个潜在功能,例如属于不同流派的电影类别:或浪漫史,以量化他对每个类别的品味。这些称为“ 潜在功能”,可以捕捉他的品味本质,而不是存储整个电影列表。

当然,这只是一个近似值,但是在另一方面,您需要存储的东西很少。

NNN11NN22N

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.