Recommendation models that utilize unique identities (IDs) to represent distinct users and items have been state-of-the-art (SOTA) and dominated the recommender systems (RS) literature for over a decade. Meanwhile, the pre-trained modality encoders, such as BERT and ViT, have become increasingly powerful in modeling the raw modality features of an item, such as text and images. Given this, a natural question arises: can a purely modality-based recommendation model (MoRec) outperforms or matches a pure ID-based model (IDRec) by replacing the itemID embedding with a SOTA modality encoder? In fact, this question was answered ten years ago when IDRec beats MoRec by a strong margin in both recommendation accuracy and efficiency. We aim to revisit this `old' question and systematically study MoRec from several aspects. Specifically, we study several sub-questions: (i) which recommendation paradigm, MoRec or IDRec, performs better in practical scenarios, especially in the general setting and warm item scenarios where IDRec has a strong advantage? does this hold for items with different modality features? (ii) can the latest technical advances from other communities (i.e., natural language processing and computer vision) translate into accuracy improvement for MoRec? (iii) how to effectively utilize item modality representation, can we use it directly or do we have to adjust it with new data? (iv) are there some key challenges for MoRec to be solved in practical applications? To answer them, we conduct rigorous experiments for item recommendations with two popular modalities, i.e., text and vision. We provide the first empirical evidence that MoRec is already comparable to its IDRec counterpart with an expensive end-to-end training method, even for warm item recommendation. Our results potentially imply that the dominance of IDRec in the RS field may be greatly challenged in the future.


翻译:十年来,利用唯一身份标识(ID)表示独特用户和项目的推荐模型一直处于领先地位,主导着推荐系统领域的文献。与此同时,预训练的模态编码器,如BERT和ViT,逐渐成为模拟项目运作的原始模态特征(如文本和图像)的有力工具。因此,一个自然的问题就产生了:是否可以通过用SOTA模态编码器替换项ID嵌入实现纯模态推荐模型(MoRec)能够胜过或与纯ID推荐模型(IDRec)相匹配?实际上,十年前这个问题就已经得到了回答,当时IDRec在推荐准确性和效率方面都比MoRec有很强的优势。我们的研究目的在于重新审视这个“老”问题,并从多个方面系统地研究MoRec。具体而言,我们研究以下几个子问题:(i)在实际场景中,特别是在IDRec具有很强优势的普通设置和热门项目情况下,哪种推荐范式(MoRec还是IDRec)表现更好?这是否适用于具有不同模态特征的项目?(ii)其他社区最新技术进步是否能够为MoRec的准确性改进带来启示(即自然语言处理和计算机视觉)?(iii)如何有效地利用物品模态表示方法?我们可以直接使用它吗,还是必须配合新数据进行调整?(iv)MoRec在实际应用中是否存在关键挑战?为了回答这些问题,我们针对两种流行的模态(文本和视觉),进行了严格的项目推荐实验。我们提供的第一个经验证据是,即使针对热门项目推荐,MoRec已经通过昂贵的端到端训练方法相当于IDRec。我们的结果可能暗示着IDRec在推荐系统领域的主导地位在未来可能会受到很大的挑战。

0
下载
关闭预览

相关内容

【RecSys22教程】多阶段推荐系统的神经重排序,90页ppt
专知会员服务
27+阅读 · 2022年9月30日
近期必读的六篇 ICLR 2021【推荐系统】相关投稿论文
专知会员服务
47+阅读 · 2020年10月13日
【KDD2020-Tutorial】自动推荐系统,Automated Recommendation System
RecSys2022 | 多阶段推荐系统的神经重排序教程
机器学习与推荐算法
0+阅读 · 2022年10月12日
跨域推荐最新前沿工作进展汇总
机器学习与推荐算法
0+阅读 · 2022年9月29日
万字长文 | TDM 三部曲
图与推荐
1+阅读 · 2022年9月22日
最新10篇对比学习推荐前沿工作
机器学习与推荐算法
2+阅读 · 2022年9月14日
TransRec: 基于混合模态反馈的可迁移推荐系统
机器学习与推荐算法
0+阅读 · 2022年7月13日
IJCAI2022推荐系统论文集锦
机器学习与推荐算法
0+阅读 · 2022年5月20日
【推荐】图像分类必读开创性论文汇总
机器学习研究会
14+阅读 · 2017年8月15日
国家自然科学基金
6+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年6月1日
Arxiv
92+阅读 · 2020年2月28日
VIP会员
相关资讯
RecSys2022 | 多阶段推荐系统的神经重排序教程
机器学习与推荐算法
0+阅读 · 2022年10月12日
跨域推荐最新前沿工作进展汇总
机器学习与推荐算法
0+阅读 · 2022年9月29日
万字长文 | TDM 三部曲
图与推荐
1+阅读 · 2022年9月22日
最新10篇对比学习推荐前沿工作
机器学习与推荐算法
2+阅读 · 2022年9月14日
TransRec: 基于混合模态反馈的可迁移推荐系统
机器学习与推荐算法
0+阅读 · 2022年7月13日
IJCAI2022推荐系统论文集锦
机器学习与推荐算法
0+阅读 · 2022年5月20日
【推荐】图像分类必读开创性论文汇总
机器学习研究会
14+阅读 · 2017年8月15日
相关基金
国家自然科学基金
6+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员