动态推荐系统


14

一个推荐系统将测量不同用户的收视率和产量的建议关于这可能是他感兴趣的项目给定用户之间的相关性。

但是,口味会随着时间而变化,因此旧评分可能无法反映当前的偏好,反之亦然。您可能曾经将“优秀”放到一本书中,现在将其评为“不太讨厌”,依此类推。而且,利益本身也会发生变化。

推荐系统如何在不断变化的环境中工作?

  1. 一种选择是切断“旧”等级,假设您正确定义了“旧”,它可能就可以正常工作(您甚至可以说等级永不过期并假装问题不存在)。但这不是最好的选择:当然,口味会演变,这是正常的生活流程,并且没有理由为什么我们不能使用曾经正确的过去评级的额外知识。
  2. 另一种选择是以某种方式容纳这些额外的知识。因此,我们不仅可以为您当前的兴趣找到一个“即时匹配”,还可以为您建议您接下来可能喜欢的事情(而不是现在可能喜欢的事情)。

我不确定我是否解释得足够好。基本上,我赞成第二种方法,并且谈论的是一种推荐系统,该系统将测量口味轨迹和产量建议之间的相关性,从而满足个人需求。好吧,我们称之为个人成长-因为它们将来自那些“口味轨迹”(而不仅仅是“口味快照”)与您的相似。

现在的问题是:我想知道是否已经存在类似于“选项2”的东西,如果存在,我想知道它是如何工作的。如果不存在,欢迎您讨论它的工作方式!:)

Answers:


8

我真的推荐Yehuda Koren(Netflix竞赛!)发表的论文《具有时间动态协同过滤》,其中详细讨论了这个问题。

我同意作者的观点,第一个选择(“切断”)不是走的路。确实会以这种方式忽略过时的首选项,但是a)一些首选项永远不会改变,因此一个人会为了识别常青树而杀死数据,并且b)过去需要一些首选项才能理解未来的首选项(例如,购买第1季->您可能会购买第2季)。

但是,Koren并没有尝试明确地识别这样的轨迹(即,以便可以预测用户的未来更改行为),因为这是一项非常艰巨的任务。您可以通过记住这一点来想象,沿着轨迹的偏好“位置”不受时间限制,而与用户的个人发展息息相关,它可能会被其他轨迹打断或穿越,或者只是以不同的方式表达。例如,如果一个人从硬动作电影转到动作电影,那么就没有确定的“入门软动作电影”之类的东西。用户可以在任何时间(时间和项目空间)进入该区域。这个问题加上数据的稀疏性使得在这里几乎不可能创建可行的模型。

相反,Koren尝试将过去的数据分为长期模式信号和每日噪声,以提高评级预测的有效性。他将这种方法应用于SVD和简单的协作neigborbood模型。不幸的是,我还没有完成数学运算,因此无法提供更多详细信息。

关于轨迹的显式建模的附加说明

面积序列挖掘提供了一些方法做的,但关键的一点是要找到项目的合适的抽象表示(因为使用本身不会因稀疏工作的项目),例如集群,使标签。但是,虽然这种方法可以提供对某些用户行为的一些见解(数据挖掘!),但对于所有客户(即大量客户)而言,在应用程序方面可能并不重要,因此,Koren建议的隐式建模可能是最终更好。


Yehuda的论文与我在说的非常接近,尽管他的确不是在谈论“味觉轨迹”。也许您是正确的,并且“味道变化率”对于任何人来说都不是固定的。.感谢您的链接!
andreister

是的,这是我想到的第一件事。
笨拙的乔·皮特2012年

2

我不知道可以使用的系统,但是如果Amazon,NetFlix或某人拥有这样的系统,我不会感到惊讶。甚至Google搜索引擎也可能具有类似的系统类型。

在上学期吴医生的课程上,我想到了这个。我首先想到的最佳方法是根据年龄增加一个加权因子。每条数据越多,其权重就越大。该方法将相对简单并且实现起来在计算上不昂贵。

但是,在更仔细地考虑此方法之后,我认为它对许多应用程序都有严重的缺陷。就我个人而言,我经常会遵循某种风格或表演一段时间,厌倦了它,继续前进到其他事物,但稍后又返回原始风格。这种倦怠,重新燃起的循环的确也出现在社会中。

因此,我倾向于使用稍微复杂一些的系统。数据将需要分为两组。当前数据-阈值将需要根据应用程序以及个人互动的时长而变化-权重将得到更大的加权,而“历史”数据的价值将随着时间的推移而缓慢下降而被降低。其次,将包括一个因素来尝试检测“关门”,在这里,人们的浓厚兴趣或参与突然消失了。类似地分类的“当前”数据将被重新分类,就好像它是历史数据一样。

这种方法都没有任何严格性或验证性,但我认为值得对该假设进行一些试验。


您对旧数据的权重较低的想法实际上类似于“选项1”。相反,我说的是不断变化的味觉的整个轨迹很重要-即,如果昨天您喜欢类型A,而今天您喜欢类型B,则系统会查看具有相同“ AB- ??”字样的其他人 味的动作和建议,明天你想流派C.
andreister

1

如我所见,协作过滤的修改版本可以工作。但是,您将需要在每个排名上保留一个时间戳,并在计算较旧排名的权重时造成损失。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.