【强化学习最新综述】详解强化学习当前进展及未来方向

2020 年 1 月 23 日 专知

【导读】强化学习最新综述新鲜出炉。在这篇文章中,作者对强化学习进行了全面的研究,包括现有的挑战、不同技术的最新发展以及未来的发展方向。文章致力于提供一个清晰简单的研究框架,能够为新的研究人员或者想全面了解强化学习领域的人提供一个参考。


摘要:
强化学习是设计强调实时响应的人工智能系统的核心组成部分之一。强化学习能够影响系统在任意的环境中的行动,不管它之前是否了解环境模型。在这篇论文中,我们对强化学习进行了全面的研究,包括了现有挑战、不同技术的最新发展情况以及未来的发展方向等多个维度。本论文的基本目标是提供一个足够简单和清晰的框架,以介绍现有的强化学习方法,从而为新的研究人员和学者了解该领域的核心进展。首先,我们以一种易于理解和比较的方式阐述了强化学习的核心技术。然后,我们分析并描述了强化学习方法的最新发展。我们的分析指出,大多数模型关注于调优策略值,而不是在特定的推理状态下调优其他东西。


地址:

https://www.zhuanzhi.ai/paper/060f307a0f77cb7abf98b0162fd8a928


便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“RL0123” 就可以获取最新强化学习综述专知资源链接索引


部分文章:

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“RL0123” 就可以获取最新强化学习综述专知资源链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“阅读原文”,了解使用专知,查看获取5000+AI主题知识资料
登录查看更多
8

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
最新《智能交通系统的深度强化学习》综述论文,22页pdf
《强化学习》简介小册,24页pdf
专知会员服务
261+阅读 · 2020年4月19日
专知会员服务
98+阅读 · 2020年3月19日
专知会员服务
197+阅读 · 2020年3月6日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
2019->2020必看的十篇「深度学习领域综述」论文
专知会员服务
269+阅读 · 2020年1月1日
自动机器学习:最新进展综述
专知会员服务
116+阅读 · 2019年10月13日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
77+阅读 · 2019年10月12日
【资源】强化学习实践教程
专知
43+阅读 · 2019年9月11日
【旷视出品】细粒度图像分析综述
专知
15+阅读 · 2019年7月11日
【综述】生成式对抗网络GAN最新进展综述
专知
57+阅读 · 2019年6月5日
对话系统近期进展
专知
37+阅读 · 2019年3月23日
106页《深度CNN-目标检测》综述进展论文
专知
4+阅读 · 2018年9月30日
A Comprehensive Survey on Transfer Learning
Arxiv
117+阅读 · 2019年11月7日
Arxiv
18+阅读 · 2019年1月16日
Arxiv
135+阅读 · 2018年10月8日
Arxiv
21+阅读 · 2018年8月30日
A Multi-Objective Deep Reinforcement Learning Framework
VIP会员
相关VIP内容
最新《智能交通系统的深度强化学习》综述论文,22页pdf
《强化学习》简介小册,24页pdf
专知会员服务
261+阅读 · 2020年4月19日
专知会员服务
98+阅读 · 2020年3月19日
专知会员服务
197+阅读 · 2020年3月6日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
2019->2020必看的十篇「深度学习领域综述」论文
专知会员服务
269+阅读 · 2020年1月1日
自动机器学习:最新进展综述
专知会员服务
116+阅读 · 2019年10月13日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
77+阅读 · 2019年10月12日
相关论文
Top
微信扫码咨询专知VIP会员