衰减系数论文 - 专知

会员服务 ·

衰减系数

Concurrent Stochastic Games with Stateful-discounted and Parity Objectives: Complexity and Algorithms

Arxiv

0+阅读 · 5月3日

Deterministic Sub-exponential Algorithm for Discounted-sum Games with Unary Weights

Arxiv

0+阅读 · 5月3日

On the Uniqueness of Solution for the Bellman Equation of LTL Objectives

Arxiv

0+阅读 · 4月7日

Policy Mirror Descent with Lookahead

Arxiv

0+阅读 · 3月21日

Competitive Revenue Extraction from Time-Discounted Transactions in the Semi-Myopic Regime

Arxiv

0+阅读 · 2月13日

Imitation Learning from Observation with Automatic Discount Scheduling

Arxiv

0+阅读 · 2月7日

Bayesian sample size determination using robust commensurate priors with interpretable discrepancy weights

Arxiv

0+阅读 · 1月19日

Multiplayer Bandit Learning, from Competition to Cooperation

Arxiv

0+阅读 · 1月12日

Data-driven Preference Learning Methods for Sorting Problems with Multiple Temporal Criteria

Arxiv

0+阅读 · 2023年11月16日

Loss Dynamics of Temporal Difference Reinforcement Learning

Arxiv

0+阅读 · 2023年11月7日

A New Policy Iteration Algorithm For Reinforcement Learning in Zero-Sum Markov Games

Arxiv

0+阅读 · 2023年10月12日

Imitation Learning from Observation with Automatic Discount Scheduling

Arxiv

0+阅读 · 2023年10月12日

Imitation Learning from Observation with Automatic Discount Scheduling

Arxiv

0+阅读 · 2023年10月11日

Reinforcement Learning with a Terminator

Arxiv

0+阅读 · 2023年10月5日

Efficiency of the Generalized Second-Price Auction for Value Maximizers

Arxiv

0+阅读 · 2023年10月4日

参考链接

微信扫码咨询专知VIP会员