上下文赌博机/上下文老虎机论文 - 专知

会员服务 ·

上下文赌博机/上下文老虎机

上下文赌博机/上下文老虎机

Diffusion Models Meet Contextual Bandits

Arxiv

0+阅读 · 10月28日

Diffusion Models Meet Contextual Bandits

Arxiv

0+阅读 · 10月26日

Exploration via Feature Perturbation in Contextual Bandits

Arxiv

0+阅读 · 10月24日

Exploration via Feature Perturbation in Contextual Bandits

Arxiv

0+阅读 · 10月20日

Learning When Not to Learn: Risk-Sensitive Abstention in Bandits with Unbounded Rewards

Arxiv

0+阅读 · 10月16日

Learning with Incomplete Context: Linear Contextual Bandits with Pretrained Imputation

Learning with Incomplete Context: Linear Contextual Bandits with Pretrained Imputation

Arxiv

0+阅读 · 10月15日

Context-Action Embedding Learning for Off-Policy Evaluation in Contextual Bandits

Arxiv

0+阅读 · 10月14日

Provable Anytime Ensemble Sampling Algorithms in Nonlinear Contextual Bandits

Arxiv

0+阅读 · 10月12日

Learning with Incomplete Context: Linear Contextual Bandits with Pretrained Imputation

Arxiv

0+阅读 · 10月10日

Latency-Aware Contextual Bandit: Application to Cryo-EM Data Collection

Arxiv

0+阅读 · 10月9日

Navigating Sparsities in High-Dimensional Linear Contextual Bandits

Navigating Sparsities in High-Dimensional Linear Contextual Bandits

Arxiv

0+阅读 · 10月9日

Batched Nonparametric Contextual Bandits

Arxiv

0+阅读 · 10月3日

Weighted Sequential Bayesian Inference for Non-Stationary Linear Contextual Bandits

Arxiv

0+阅读 · 10月1日

Dynamic Trust Calibration Using Contextual Bandits

Arxiv

0+阅读 · 9月27日

Cramming Contextual Bandits for On-policy Statistical Evaluation

Arxiv

0+阅读 · 4月15日

参考链接

微信扫码咨询专知VIP会员