某人会喜欢图像的可能性


11

我遇到以下问题:
-我们设置了N个人
-我们设置了K张图片
-每个人都对一定数量的图片进行评分。一个人可能喜欢或不喜欢图像(这是仅有的两个可能性)。-问题是如何计算某些人喜欢特定图像的可能性。

我将举例说明我的直觉。
N = 4
K = 5
+表示该人喜欢该图像
-表示该人不喜欢该图像
0表示尚未向该人询问该图像,并且应该预测该值

x 1 2 3 4 5    
1 + - 0 0 +   
2 + - + 0 +  
3 - - + + 0  
4 - 0 - - -

人1可能喜欢图像3,因为人2具有相似的偏好,人2喜欢图像3。
人4可能不喜欢图像2,因为没有人喜欢它,另外人4不喜欢大多数图像。

有没有众所周知的方法可以用来计算这种可能性?


由于我的经验有限,我无法给出确切答案。但是,我相信您可以通过logit使用面板数据(因为您在示例中考虑了个体内部以及个体之间的差异)方法。也许其他人可以对此进行详细说明...
teucer 2010年

您的小示例非常有用,但是我认为您的实际数据集更大。实际Nk多大(即,大约)多大?
一站式

N和k可能很大,但是计算能力不是问题。
Tomek Tarczynski

Answers:



6

对于机器学习来说,这似乎是一个好问题,因此我将重点介绍这组方法。

首先也是最明显的想法是kNN算法。在那里,您首先要计算观看者之间的相似度,然后用相似用户对该图片的平均投票来预测缺失的投票。有关详细信息,请参见Wikipedia

另一个想法是在此数据上生长无监督的随机森林(无论哪种方式,都具有图像或人物的属性,无论哪种更好),然后根据森林结构估算缺失的数据;整个方法在R randomForest包中实现和描述,查找rfImpute功能。

最后,您可以将问题重构为简单的分类任务,比如说使矩阵中的每个零成为一个对象,然后尝试考虑一些合理的描述符(例如平均观看者投票,平均图像投票,最高,第二最高...的投票)。相似的查看器,与图像相同,可能还有一些外部数据(图像的平均色调,投票者的年龄等),然后尝试对该数据进行各种分类(SVM,RF,NB等)。

还有一些更复杂的可能性。要获得概述,您可以寻找Netflix奖挑战(这是一个类似的问题)解决方案。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.