4 ^/ B8 a& d6 |" P2 V# D U * s) |+ P A" {0 N' Q$ c- [图2.1:显式反馈和隐式反馈 / u& L" ^+ y0 e 传统的推荐系统使用显式/隐式信息作为输入来进行预测,存在两个主要的问题: 4 f' n, |1 z7 Y$ t (1)稀疏性问题: 实际场景中,用户和物品的交互信息往往是非常稀疏的。如电影推荐中,电影往往成千上万部,但是用户打过分的电影往往只有几十部。使用如此少的观测数据来预测大量的未知信息,会极大增加过拟合的风险。' I H, ~) a i7 C% |# A
4 Y; J" |+ i, Y4 S
(2)冷启动问题: 对于新加入的用户或者物品,其没有对应的历史信息,因此难以进行准确的建模和推荐。解决稀疏性和冷启动问题的一个常见思路是在推荐算法中额外引入一些辅助信息(side information)作为输入。辅助信息可以丰富对用户和物品的描述、增强推荐算法的挖掘能力,从而有效地弥补交互信息的稀疏或缺失。常见的辅助信息包括: 社交网络:一个用户对某个物品感兴趣,他的朋友可能也会对该物品感兴趣 用户/物品属性:拥有同种属性的用户可能会对同一类物品感兴趣 图像/视频/音频/文本等多媒体信息:例如商品图片、电影预告片、音乐、新闻标题等 上下文信息:用户-物品交互的时间、地点、当前会话信息等。+ O: Z, u' m; V c/ \
近年来,知识图谱(knowledge graph)作为一种新兴的辅助信息,逐渐引起了学者们的关注。! T9 B: v1 N. Q$ b# A