在本文中,我们提出了一种层次自适应上下文强盗方法(HATCH)来进行有预算约束的上下文强盗的策略学习。HATCH采用了一种自适应的方法,根据剩余资源/时间和不同用户上下文之间的报酬分配来分配勘探资源。此外,我们利用丰富的上下文特征信息来寻找最佳的个性化推荐。

成为VIP会员查看完整内容
20

相关内容

近期必读的五篇KDD 2020【图神经网络 (GNN) 】相关论文_Part2
专知会员服务
157+阅读 · 2020年6月30日
近期必读的6篇顶会WWW2020【推荐系统】相关论文-Part3
专知会员服务
57+阅读 · 2020年4月14日
近期必读的5篇顶会WWW2020【推荐系统】相关论文-Part2
专知会员服务
68+阅读 · 2020年4月7日
专知会员服务
85+阅读 · 2020年1月20日
层级强化学习概念简介
CreateAMind
14+阅读 · 2019年6月9日
论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法
开放知识图谱
30+阅读 · 2019年3月26日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
图上的归纳表示学习
科技创新与创业
22+阅读 · 2017年11月9日
推荐系统杂谈
架构文摘
28+阅读 · 2017年9月15日
Arxiv
30+阅读 · 2019年3月13日
VIP会员
相关资讯
微信扫码咨询专知VIP会员