强化学习是机器学习领域的研究热点, 是考察智能体与环境的相互作用, 做出序列决策、优化策略并最大化累积回报的过程. 强化学习具有巨大的研究价值和应用潜力, 是实现通用人工智能的关键步骤. 本文综述了强化学习算法与应用的研究进展和发展动态, 首先介绍强化学习的基本原理, 包括马尔可夫决策过程、价值函数、探索-利用问题. 其次, 回顾强化学习经典算法, 包括基于价值函数的强化学习算法、基于策略搜索的强化学习算法、结合价值函数和策略搜索的强化学习算法, 以及综述强化学习前沿研究, 主要介绍多智能体强化学习和元强化学习方向. 最后综述强化学习在游戏对抗、机器人控制、城市交通和商业等领域的成功应用, 以及总结与展望.

http://www.c-s-a.org.cn/csa/article/abstract/7701

成为VIP会员查看完整内容
109

相关内容

专知会员服务
78+阅读 · 2021年2月16日
专知会员服务
182+阅读 · 2021年2月4日
元强化学习综述及前沿进展
专知会员服务
60+阅读 · 2021年1月31日
深度强化学习在智能制造中的应用展望综述
专知会员服务
93+阅读 · 2021年1月28日
专知会员服务
100+阅读 · 2020年12月31日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
132+阅读 · 2020年12月22日
专知会员服务
173+阅读 · 2020年11月23日
专知会员服务
120+阅读 · 2020年11月15日
最新《智能交通系统的深度强化学习》综述论文,22页pdf
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
当深度强化学习遇见图神经网络
专知
224+阅读 · 2019年10月21日
RL圣经出中文版了
CreateAMind
18+阅读 · 2019年9月13日
强化学习精品书籍
平均机器
24+阅读 · 2019年1月2日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
26+阅读 · 2018年8月17日
Arxiv
0+阅读 · 2021年2月18日
Generalization and Regularization in DQN
Arxiv
6+阅读 · 2019年1月30日
VIP会员
相关主题
相关VIP内容
专知会员服务
78+阅读 · 2021年2月16日
专知会员服务
182+阅读 · 2021年2月4日
元强化学习综述及前沿进展
专知会员服务
60+阅读 · 2021年1月31日
深度强化学习在智能制造中的应用展望综述
专知会员服务
93+阅读 · 2021年1月28日
专知会员服务
100+阅读 · 2020年12月31日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
132+阅读 · 2020年12月22日
专知会员服务
173+阅读 · 2020年11月23日
专知会员服务
120+阅读 · 2020年11月15日
最新《智能交通系统的深度强化学习》综述论文,22页pdf
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
相关资讯
当深度强化学习遇见图神经网络
专知
224+阅读 · 2019年10月21日
RL圣经出中文版了
CreateAMind
18+阅读 · 2019年9月13日
强化学习精品书籍
平均机器
24+阅读 · 2019年1月2日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
26+阅读 · 2018年8月17日
微信扫码咨询专知VIP会员