成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
上下文赌博机/上下文老虎机
关注
0
综合
百科
VIP
热门
动态
论文
精华
Linear Contextual Bandits with Hybrid Payoff: Revisited
Arxiv
0+阅读 · 6月14日
Towards Domain Adaptive Neural Contextual Bandits
Arxiv
0+阅读 · 6月13日
A Robust Mixed-Effects Bandit Algorithm for Assessing Mobile Health Interventions
Arxiv
0+阅读 · 6月7日
Batched Nonparametric Contextual Bandits
Arxiv
0+阅读 · 6月10日
Optimal Batched Linear Bandits
Arxiv
0+阅读 · 6月6日
Strategic Linear Contextual Bandits
Arxiv
0+阅读 · 6月1日
VITS : Variational Inference Thomson Sampling for contextual bandits
Arxiv
0+阅读 · 6月4日
Uncertainty of Joint Neural Contextual Bandit
Arxiv
0+阅读 · 6月4日
Offline Oracle-Efficient Learning for Contextual MDPs via Layerwise Exploration-Exploitation Tradeoff
Arxiv
0+阅读 · 5月28日
Learning Personalized Decision Support Policies
Arxiv
0+阅读 · 5月27日
Indexed Minimum Empirical Divergence-Based Algorithms for Linear Bandits
Arxiv
0+阅读 · 5月24日
Logarithmic Smoothing for Pessimistic Off-Policy Evaluation, Selection and Learning
Arxiv
0+阅读 · 5月23日
To Ask or Not To Ask: Human-in-the-loop Contextual Bandits with Applications in Robot-Assisted Feeding
Arxiv
0+阅读 · 5月11日
Simulation-Based Benchmarking of Reinforcement Learning Agents for Personalized Retail Promotions
Arxiv
0+阅读 · 5月16日
Nearly Minimax Optimal Regret for Multinomial Logistic Bandit
Arxiv
0+阅读 · 5月16日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top