潜在功能的含义?


15

我试图理解推荐系统的矩阵分解模型,并且我总是读“潜在特征”,但这意味着什么?我知道功能对训练数据集意味着什么,但我无法理解潜在功能的概念。我所能找到的有关该主题的每篇论文都太浅了。

编辑:

如果您至少可以指出一些指导我想法的论文。


下面是简单的例子,可以帮助你quuxlabs.com/blog/2010/09/...
Akavall

Answers:


9

潜在的意思是不能直接观察到。该术语在PCA和因子分析中的常用用法是将大量直接可观察特征的尺寸缩小为较小的一组间接可观察特征。


那么缩小的尺寸是潜在的特征吗?在PCA的情况下,协方差矩阵的特征向量,即主成分,对吗?
杰克吐温

正确@AlexTwain
samthebest 2014年

您能为我提供提及的教程/论文吗?我找不到任何系统的教程/论文!
杰克吐温

那么维基页面很不错,你可以按照引用那里,如果你真的想en.wikipedia.org/wiki/Latent_variable
samthebest

1
@JackTwain正确的PCA类推是,潜在特征是特征向量。主要成分是分配给每个观测值的主要特征向量的权重。在其他矩阵分解模型中,潜在特征扮演着特征向量的角色。这听起来似乎很古怪,但是这个错误不会给人们带来混乱。
推测

3

在分解方法的上下文中,潜在特征通常是用来表征每个维度上的项目。让我以身作则。

假设我们有项用户交互的矩阵。在矩阵分解方法的模型的假设是,每个小区ř ù 该矩阵的被生成,例如,p Ť ü q -潜矢量之间的点积p ü,描述用户ù和潜矢量q ,描述项目。直观地,该乘积测量这些向量的相似程度。在训练过程中,您想找到“好的”向量,以使逼近误差最小。RRuipuTqipuuqii

puqi


我读过一些论文,其中潜在特征(例如“用户向量”)用于预测某些目标变量,让我们以性别为例。它可以通过这种方式构建预测模型而“起作用”。我的问题是,“用户向量”与用户对“已访问”的所有商品的“项目向量”取平均值之间有什么区别?IOW,您是否希望上述预测模型相对于另一种更好或更差?谢谢(如果您看到了)。
thecity2

@ thecity2,您可以平均用户的项目,当您与没有预先计算用户向量的新用户打交道时,这实际上可能很有用(尽管要进行一些优化迭代来计算它很难)。普通平均还存在一个问题:用户消费的商品越多-他们的平均商品向量可能接近于零(由于典型的L2正则化器,以及高维空间的其他讨厌属性)。最后,拥有一个单独的向量更加灵活:您的模型可以学习这种平均。
Artem Sobolev

也就是说,尝试使用用户的历史记录来建模用户的向量。例如,请参见论文“通过对互联网广播流进行建模来构建自己的音乐推荐人”
Artem Sobolev,2017年

0

我要说的是,因素要比变量的主要组成部分更具代表性,才能理解变量的“潜伏期” /隐藏性。潜伏期是行为科学家根据多个项目/措施来测量诸如感觉,悲伤之类的感知结构并为无法直接测量的此类隐藏变量得出数字的原因之一。


0

在这里,您的数据是各种用户对各种电影给出的评分。正如其他人指出的那样,潜伏意味着不能直接观察到。

对于电影,其潜在特征决定动作,浪漫史,故事情节,著名演员等的数量。类似地,对于由手写数字组成的另一个数据集,潜在变量可以是边缘角度,偏斜等。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.