推荐系统论文:
顶会论文整理:
同时欢迎大家使用 RecBole(伯乐)推荐系统工具包,在 GitHub 上已经有 2.1k 个 star 和 400 个 fork。RecBole 是一个基于 PyTorch 实现的,面向研究者的,易于开发与复现的,统一、全面、高效的推荐系统代码库。目前已经有 83 个常见的推荐模型,覆盖主流的研究任务,支持全面多样的数据处理与评测方式。同时我们也整理了 41 个常用的推荐系统数据集,可以直接在 RecBole 中使用。
此外,RecBole2.0 在伯乐框架的基础上推出 8 个最新扩展包,覆盖从数据到模型多个推荐系统最新的主题和方向,为推荐系统多个领域的研究提供了易用又强大的工具库!欢迎大家关注我们小组的推荐算法开源工作~
本文根据文章的侧重点将这些论文分为以下三大类和若干小类:
作为推荐系统最经典的算法之一,协同过滤通过挖掘用户和物品的交互信息,将相似的物品推荐给类似的用户。从早期基于用户或物品邻域的 UserKNN 和 ItemKNN 方法,到基于矩阵分解的 SVD++、BPRMF,再到近几年基于图神经网络的 NGCF、LightGCN 等模型,基于相似性进行推荐的思路时至今日仍然在新技术的推动下焕发着强大的生机。最新的针对协同过滤的研究依然在探索如何捕获交互中的相似性信息,包括建模更高阶的交互,设计更复杂的度量空间等。
序列推荐也是十分热门的研究方向。通过建模用户的历史交互序列来刻画用户偏好。从早期的基于Markov Chain来建模。到基于序列模型建模,如GRU,Transformer等。随着图神经网络的不断发展,也就不少基于GNN的序列推荐方法被提出。一些工作也开始尝试将预训练引入序列推荐中,建模更通用的用户、商品、序列表征。
这类工作旨在对用户是否点击展示的商品/广告做出二分类预测。近期研究热点包括高阶特征交互,设计高阶向量交互运算来构造显式的特征交互;图表示学习,异构特征图预训练增强特征表示;网络结构化搜索,采用强化学习或进化算法优化特征工程搜索最佳网络结构;多任务学习,通过点击率与转化率联合建模实现多个任务间互相增益。
这类任务旨在利用结构化的信息辅助推荐。早期的工作聚焦于meta-path方法,近年来随着图神经网络技术的不断发展,基于GNN的方法已经成为主流方向。
对话推荐系统通过多轮对话,建模用户的动态偏好从而完成推荐。目前的主流技术包括强化学习对话策略;知识增强对话推荐系统;对话推荐中的可控增强;以及统一推荐、对话框架等。
除了上述的较为经典的推荐任务,最近的顶会文章还有一些其他有意思的任务。
推荐系统去偏旨在消除推荐数据/模型中由偏差带来的不良影响。其中偏差包括比较常见的流行度偏差 (popularity bias),选择偏差 (selection bias),曝光偏差 (exposure bias),位置偏差 (position bias) 以及其他各种偏差。目前的主流技术包括解耦用户表示,从因果角度进行解耦;推理阶段合理利用偏差,通过在推理阶段注入偏差来消除训练期间的偏差影响;关注动态场景下如何消除偏差等。
推荐系统的公平性指在个性化推荐时进一步考虑推荐的公平性。目前的主流技术包括引入公平性指标,在训练时同时优化准确性和公平性的指标;因果推断去偏,采用因果推断理论缓解偏差问题,从而提升公平性;对抗学习方法,采用 GAN 等对抗训练方法,在训练中引入公平性的权衡;推荐结果重排序,在已有推荐结果上重新排序, 兼顾准确性和公平性等。
可解释推荐要求推荐系统不仅要提供高质量的推荐,还要对结果做出解释。目前的主流技术包括基于强化学习,将推荐模型作为环境的一部分,并对生成的解释做出奖励;基于反事实,因果推断,基于因果推断框架量化推荐理由,分析关键因素;基于知识图谱,利用知识的语义捕捉实体关系,提升解释质量;基于预训练语言模型,利用预训练语言模型生成个性化的高质量解释
从有推荐系统开始就存在的痛点问题,目前比较流行基于meta-learning,transfer-learning的方法。
多样化的推荐结果应该尽可能包含不同的商品来满足用户的多种兴趣。目前的主流技术包括基于数据增广;基于动态的图神经网络;多目标联合优化;强化学习等。
推荐系统的隐私保护旨在保护用户隐私的前提下进行推荐。目前的研究热点包括联邦学习加密优化,结合密码学方法或模糊化方法,进一步优化安全性;联邦学习效率优化,基于采样算法研究加快收敛速度、减少通讯次数等。