In causal bandit problems, the action set consists of interventions on variables of a causal graph. Several researchers have recently studied such bandit problems and pointed out their practical applications. However, all existing works rely on a restrictive and impractical assumption that the learner is given full knowledge of the causal graph structure upfront. In this paper, we develop novel causal bandit algorithms without knowing the causal graph. Our algorithms work well for causal trees, causal forests and a general class of causal graphs. The regret guarantees of our algorithms greatly improve upon those of standard multi-armed bandit (MAB) algorithms under mild conditions. Lastly, we prove our mild conditions are necessary: without them one cannot do better than standard MAB algorithms.


翻译:在因果图表的变数方面,行动集包括了对因果图表变量的干预。一些研究人员最近研究了此类土匪问题,并指出了它们的实际应用。然而,所有现有的工程都依赖于一种限制性和不切实际的假设,即学习者事先充分了解因果图表结构。在本文中,我们在不了解因果图表的情况下开发了新的因果土算法。我们的算法在因果树、因果森林和一般因果图表类别方面运作良好。我们算法的遗憾保证在温和条件下大大改善了标准的多臂土匪算法。最后,我们证明我们的温和条件是必要的:没有这些算法,就无法比标准的MAB算法做得更好。

0
下载
关闭预览

相关内容

因果图,Causal Graphs,52页ppt
专知会员服务
250+阅读 · 2020年4月19日
【2020新书】图机器学习,Graph-Powered Machine Learning
专知会员服务
343+阅读 · 2020年1月27日
必读的7篇IJCAI 2019【图神经网络(GNN)】相关论文-Part2
专知会员服务
61+阅读 · 2020年1月10日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
60+阅读 · 2019年10月17日
AAAI2020 图相关论文集
图与推荐
11+阅读 · 2020年7月15日
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
43+阅读 · 2019年1月3日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
A causal view on compositional data
Arxiv
0+阅读 · 2022年1月14日
Arxiv
10+阅读 · 2021年11月3日
Arxiv
4+阅读 · 2020年3月19日
Arxiv
112+阅读 · 2020年2月5日
Arxiv
17+阅读 · 2019年3月28日
VIP会员
相关资讯
AAAI2020 图相关论文集
图与推荐
11+阅读 · 2020年7月15日
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
43+阅读 · 2019年1月3日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
相关论文
A causal view on compositional data
Arxiv
0+阅读 · 2022年1月14日
Arxiv
10+阅读 · 2021年11月3日
Arxiv
4+阅读 · 2020年3月19日
Arxiv
112+阅读 · 2020年2月5日
Arxiv
17+阅读 · 2019年3月28日
Top
微信扫码咨询专知VIP会员