"轻量"且"优秀"的序列推荐模型 - 专知

会员服务 ·

0

"轻量"且"优秀"的序列推荐模型

2021 年 8 月 21 日 机器学习与推荐算法

↑↑↑关注后"星标"机器学习与推荐算法

炼丹笔记干货

作者：十方

self-attention已经广泛使用在序列化推荐中，但是存在复杂度较高且过度参数化的问题，并且由于隐式位置编码的缘故，会使模型在对items之间的关系错误建模。这篇来自微软的论文《Lighter and Better: Low-Rank Decomposed Self-Attention Networks for Next-Item Recommendation》提出了LightSans去解决这些问题。该模型把用户历史行为序列映射成潜在的兴趣，通过这种方式在线性时间和空间“限制”了用户历史行为序列的长度，缓解了过度参数化的问题。

LightSANs

LightSANs假设用户历史上有过的交互的items可以被分类为不超过k类(k是一个很小的定值)，基于这个假设，用户历史行为的items都需要和k个潜在的兴趣做交互(论文里叫item-to-interest)，避免了item之间的交互，使得模型参数变少。然后该模型还提出了decoupled位置编码去描述位置直接的相关性。关于LightSANs的细节见下图：

Item-to-Interest Aggregation:

有了每个items可以归类为k个兴趣中的一个的假设，我们就可以用一个可学习的function，把n*d的序列映射成k*d，如下公式所示：

通过这种方式把item集合聚成k个向量表达，有效的降低了attention矩阵的大小。因为兴趣更能表达用户的倾向，attention的weights就能更精确的描述不常见的items。

Item-to-Interest Interaction:

简单来说，就是把self-attention中的K和V替换成我们上一步聚合的k个兴趣，如下式所示:

当然，这里也用了multi-head，i表示head ID。

Decoupled Position Encoding:

传统的position embedding,就是每个位置的item embedding直接加上position embedding,然后描述两个位置item的关系如下式:

展开就是:

论文提到上式的最后两项并没有那么合理,描述item到position的关系是有问题的,限制了模型的挖掘序列关系的能力.所以该文提出了下式对序列之间位置的关系进行编码:

这样做序列位置之间的关系就被显式的指定,避免了对item-position直接关系的编码,提高了模型的表达能力.loss函数也很简单,就是用的交叉熵损失.

实验

从实验上看,该模型不仅效果好,性能还和彪悍,同时也节约内存.

参考文献

1、Lighter and Better: Low-Rank Decomposed Self-Attention Networks for Next-Item Recommendation

https://www.microsoft.com/en-us/research/uploads/prod/2021/05/LighterandBetter_Low-RankDecomposedSelf-AttentionNetworksforNext-ItemRecommendation.pdf

交流群已经成立，后台回复“加群”扫码后进群

登录查看更多

0

相关内容

序列推荐

WWW 2022 ：基于纯MLP架构的序列推荐模型

WWW 2022 ：基于纯MLP架构的序列推荐模型

专知会员服务

16+阅读 · 2022年3月20日

WSDM'22「京东」个性化会话推荐：异构全局图神经网络

WSDM'22「京东」个性化会话推荐：异构全局图神经网络

专知会员服务

23+阅读 · 2022年1月7日

【SIGIR2021】图神经网络序列推荐

专知会员服务

57+阅读 · 2021年6月30日

五篇 CIKM2020【信息检索 +推荐】相关论文，人大高瓴人工智能学院

五篇 CIKM2020【信息检索 +推荐】相关论文，人大高瓴人工智能学院

专知会员服务

48+阅读 · 2020年8月20日

【基于元学习的推荐系统】5篇相关论文

专知会员服务

88+阅读 · 2020年1月20日

【CCF-A】TOIS2022：基于元学习的冷启动序列推荐

【CCF-A】TOIS2022：基于元学习的冷启动序列推荐

专知

2+阅读 · 2022年3月31日

WWW 2022 ：基于纯MLP架构的序列推荐模型

WWW 2022 ：基于纯MLP架构的序列推荐模型

专知

0+阅读 · 2022年3月20日

CIKM'21 CBML | 基于聚类的元学习序列推荐方法

CIKM'21 CBML | 基于聚类的元学习序列推荐方法

图与推荐

1+阅读 · 2021年12月21日

CIKM21 | 图+推荐系统: 比LightGCN更有效的UltraGCN

CIKM21 | 图+推荐系统: 比LightGCN更有效的UltraGCN

机器学习与推荐算法

2+阅读 · 2021年11月30日

KDD 2019开源论文 | 基于异质图神经网络的用户意图推荐

KDD 2019开源论文 | 基于异质图神经网络的用户意图推荐

PaperWeekly

31+阅读 · 2019年11月2日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向海量图像搜索的高维索引结构与快速检索算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于面向话题的加权社会网络的个性化推荐及检索技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于链接权重化的链接预测研究

国家自然科学基金

1+阅读 · 2011年12月31日

计算力学的可信性问题及其量化模型研究

国家自然科学基金

0+阅读 · 2008年12月31日

MetaKG: Meta-learning on Knowledge Graph for Cold-start Recommendation

Arxiv

0+阅读 · 2022年4月18日

Controllable Multi-Interest Framework for Recommendation

Arxiv

18+阅读 · 2020年8月3日

Learning Heterogeneous Knowledge Base Embeddings for Explainable Recommendation

Arxiv

11+阅读 · 2018年5月9日

Attention-based Group Recommendation

Arxiv

14+阅读 · 2018年4月18日

Learning over Knowledge-Base Embeddings for Recommendation

Arxiv

23+阅读 · 2018年3月22日

VIP会员

相关主题

过度参数化

自注意力机制

注意力机制

相关VIP内容

WWW 2022 ：基于纯MLP架构的序列推荐模型

WWW 2022 ：基于纯MLP架构的序列推荐模型

专知会员服务

16+阅读 · 2022年3月20日

WSDM'22「京东」个性化会话推荐：异构全局图神经网络

WSDM'22「京东」个性化会话推荐：异构全局图神经网络

专知会员服务

23+阅读 · 2022年1月7日

【SIGIR2021】图神经网络序列推荐

专知会员服务

57+阅读 · 2021年6月30日

五篇 CIKM2020【信息检索 +推荐】相关论文，人大高瓴人工智能学院

五篇 CIKM2020【信息检索 +推荐】相关论文，人大高瓴人工智能学院

专知会员服务

48+阅读 · 2020年8月20日

【基于元学习的推荐系统】5篇相关论文

专知会员服务

88+阅读 · 2020年1月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《基于AI的动态任务分配策略实现多智能体系统有意义人类控制》报告

《超越连接：AI驱动网络未来愿景》最新报告

人工智能赋能多域作战：能力与挑战

《战场空间决策优势：AI基础与应用研究》总结报告

相关资讯

【CCF-A】TOIS2022：基于元学习的冷启动序列推荐

【CCF-A】TOIS2022：基于元学习的冷启动序列推荐

专知

2+阅读 · 2022年3月31日

WWW 2022 ：基于纯MLP架构的序列推荐模型

WWW 2022 ：基于纯MLP架构的序列推荐模型

专知

0+阅读 · 2022年3月20日

CIKM'21 CBML | 基于聚类的元学习序列推荐方法

CIKM'21 CBML | 基于聚类的元学习序列推荐方法

图与推荐

1+阅读 · 2021年12月21日

CIKM21 | 图+推荐系统: 比LightGCN更有效的UltraGCN

CIKM21 | 图+推荐系统: 比LightGCN更有效的UltraGCN

机器学习与推荐算法

2+阅读 · 2021年11月30日

KDD 2019开源论文 | 基于异质图神经网络的用户意图推荐

KDD 2019开源论文 | 基于异质图神经网络的用户意图推荐

PaperWeekly

31+阅读 · 2019年11月2日

相关基金

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向海量图像搜索的高维索引结构与快速检索算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于面向话题的加权社会网络的个性化推荐及检索技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于链接权重化的链接预测研究

国家自然科学基金

1+阅读 · 2011年12月31日

计算力学的可信性问题及其量化模型研究

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

MetaKG: Meta-learning on Knowledge Graph for Cold-start Recommendation

Arxiv

0+阅读 · 2022年4月18日

Controllable Multi-Interest Framework for Recommendation

Arxiv

18+阅读 · 2020年8月3日

Learning Heterogeneous Knowledge Base Embeddings for Explainable Recommendation

Arxiv

11+阅读 · 2018年5月9日

Attention-based Group Recommendation

Arxiv

14+阅读 · 2018年4月18日

Learning over Knowledge-Base Embeddings for Recommendation

Arxiv

23+阅读 · 2018年3月22日

大家都在搜

大型语言模型

蓝牙安全攻防

太合音乐上市

水下稳定性

【泡泡读者来搞】ROS、Simulink、Carsim的互联与规划、控制算法的验证

微信扫码咨询专知VIP会员