Exploration in Online Advertising Systems with Deep Uncertainty-Aware Learning

基于深度置信度感知学习的广告投放探索方案

摘要:目前先进的在线广告系统得益于个性化方法,例如点击率预估技术。依托于深度学习丰富的表示能力,深层点击率预估模型在工业界获得大规模应用,并取得了巨大成功。但是,这些方法可能会受限于“缺乏探索”问题。此前的一系列工作借助上下文赌博机(Contextual Bandit)方法来解决探索与利用的权衡问题,但这些方法难以兼容深层模型,因而表示能力受限。

在本文中,我们提出了一种新颖的深度置信度感知学习(DUAL)方法,基于高斯过程(Gaussian Process)学习点击率模型。该方法可以在保持深层模型灵活表示能力的同时,提供模型预估不确定性的估计。DUAL可以轻松地在现有模型上实现,并以极少的额外计算开销部署于实时系统中。通过结合DUAL对模型预估不确定性的估计能力与Bandit算法,我们进一步提出了基于DUAL的广告投放策略,以提高广告系统的长期效用。在几个公共数据集上的实验结果均表明了该方法的有效性。同时,在阿里巴巴展示外投广告平台上部署的在线A/B测试结果显示,DUAL方法显著提升了平台收入等指标。 论文下载:

https://www.zhuanzhi.ai/paper/63a6cc77b85e7ae3367742b46acacf74

成为VIP会员查看完整内容
14

相关内容

专知会员服务
43+阅读 · 2021年4月18日
【WWW2021】双曲图卷积网络的协同过滤
专知会员服务
39+阅读 · 2021年3月26日
专知会员服务
19+阅读 · 2021年3月18日
【WWW2021】基于双侧深度上下文调制的社会化推荐系统
专知会员服务
27+阅读 · 2021年1月28日
【基于元学习的推荐系统】5篇相关论文
专知
9+阅读 · 2020年1月20日
李飞飞等ICLR2019论文:构建人类眼睛感知评估
全球人工智能
4+阅读 · 2019年6月4日
Arxiv
7+阅读 · 2021年4月30日
Arxiv
19+阅读 · 2021年4月8日
Joint Monocular 3D Vehicle Detection and Tracking
Arxiv
8+阅读 · 2018年12月2日
VIP会员
相关VIP内容
专知会员服务
43+阅读 · 2021年4月18日
【WWW2021】双曲图卷积网络的协同过滤
专知会员服务
39+阅读 · 2021年3月26日
专知会员服务
19+阅读 · 2021年3月18日
【WWW2021】基于双侧深度上下文调制的社会化推荐系统
专知会员服务
27+阅读 · 2021年1月28日
微信扫码咨询专知VIP会员