It is common in recommendation systems that users both consume and produce information as they make strategic choices under uncertainty. While a social planner would balance "exploration" and "exploitation" using a multi-armed bandit algorithm, users' incentives may tilt this balance in favor of exploitation. We consider Bayesian Exploration: a simple model in which the recommendation system (the "principal") controls the information flow to the users (the "agents") and strives to incentivize exploration via information asymmetry. A single round of this model is a version of a well-known "Bayesian Persuasion game" from [Kamenica and Gentzkow]. We allow heterogeneous users, relaxing a major assumption from prior work that users have the same preferences from one time step to another. The goal is now to learn the best personalized recommendations. One particular challenge is that it may be impossible to incentivize some of the user types to take some of the actions, no matter what the principal does or how much time she has. We consider several versions of the model, depending on whether and when the user types are reported to the principal, and design a near-optimal "recommendation policy" for each version. We also investigate how the model choice and the diversity of user types impact the set of actions that can possibly be "explored" by each type.


翻译:在建议系统中,用户在不确定的情况下在作出战略选择时消费和制作信息是常见的。虽然社会规划者会用多武装土匪算法来平衡“探索”和“开发”的平衡,但用户的激励因素可能会使这种平衡偏向于剥削。我们认为巴伊西亚探索:一种简单的模式,建议系统(“主要”)控制向用户(“代理人”)的信息流动,并努力通过信息不对称来激励探索。这一模式的一回合是[卡梅尼卡和根茨科夫]中众所周知的“Bayesian Persusaciation 游戏”的版本。我们允许不同用户,从先前的工作中放松一个主要的假设,即用户有相同的偏好,从一个步到另一个步骤。我们现在的目标是学习最个性化的建议。一个特别的挑战是,可能无法鼓励某些用户类型采取某些行动,不管她主要做什么或有多少时间。我们考虑该模型的若干版本,取决于用户类型是否和何时报告给每个用户类型,“我们可能每个用户类型对本型式的影响” 设计一个“我们所设定的模型。

0
下载
关闭预览

相关内容

《计算机信息》杂志发表高质量的论文,扩大了运筹学和计算的范围,寻求有关理论、方法、实验、系统和应用方面的原创研究论文、新颖的调查和教程论文,以及描述新的和有用的软件工具的论文。官网链接:https://pubsonline.informs.org/journal/ijoc
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
143+阅读 · 2019年10月12日
机器学习入门的经验与建议
专知会员服务
89+阅读 · 2019年10月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
LibRec 精选:CCF TPCI 的推荐系统专刊征稿
LibRec智能推荐
4+阅读 · 2019年1月12日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
Heterogeneous Deep Graph Infomax
Arxiv
12+阅读 · 2019年11月19日
Parsimonious Bayesian deep networks
Arxiv
5+阅读 · 2018年10月17日
Arxiv
6+阅读 · 2018年3月28日
Arxiv
9+阅读 · 2018年3月23日
VIP会员
Top
微信扫码咨询专知VIP会员