在推荐器中,很常见的是我们拥有带有标签的用户产品数据,例如“点击”。为了学习模型,我需要单击和不单击数据。
生成最简单的方法是获取在点击数据中找不到的用户产品对。但是,这可能会产生误导。例:
user1, product1 (click)
user2, product2 (click)
user2, product3 (click)
user3, product2 (click)
我可以将user1与product1以外的所有产品一起使用,并将它们标记为“ no_click”,依此类推。但是,事实可能并非如此。如果显示了product2,则user1可能会单击product2。但是仅仅因为向他展示了其他产品集-他没有机会决定点击/不点击product2。
那么如何解决一元数据问题呢?