成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
最优策略
关注
0
最优策略亦称“平衡策略”、“稳定策略”。在对策中,能够形成平衡局势的局中人的策略。最优策略构成对策的解。它根据局中人选取策略的形式是有目的地选取,还是根据一定的概率值随机地选取,分成最优纯策略和最优混合策略两类。在有鞍点的矩阵对策中,参与对策的局中人根据鞍点选取并构成平衡局势的策略为最优纯策略。在没有鞍点的矩阵决策中,参与对策的局中人的最优策略为最优混合决策。
综合
百科
VIP
热门
动态
论文
精华
Understanding Optimal Portfolios of Strategies for Solving Two-player Zero-sum Games
Arxiv
0+阅读 · 11月23日
Non-stationary and Varying-discounting Markov Decision Processes for Reinforcement Learning
Arxiv
0+阅读 · 12月2日
Distributionally Robust Markov Games with Average Reward
Arxiv
0+阅读 · 12月5日
Distributionally Robust Markov Games with Average Reward
Arxiv
0+阅读 · 11月11日
Robust and Reliable Stochastic Resource Allocation via Tail Waterfilling
Arxiv
1+阅读 · 2023年5月1日
Optimal regimes for algorithm-assisted human decision-making
Arxiv
0+阅读 · 2023年4月19日
Using Offline Data to Speed-up Reinforcement Learning in Procedurally Generated Environments
Arxiv
0+阅读 · 2023年4月18日
Designing Policies for Truth: Combating Misinformation with Transparency and Information Design
Arxiv
0+阅读 · 2023年4月17日
Action Pick-up in Dynamic Action Space Reinforcement Learning
Arxiv
0+阅读 · 2023年4月3日
Investigation of risk-aware MDP and POMDP contingency management autonomy for UAS
Arxiv
0+阅读 · 2023年4月3日
Task Phasing: Automated Curriculum Learning from Demonstrations
Arxiv
0+阅读 · 2023年3月28日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top