强化学习的自动驾驶控制技术研究进展

2021 年 2 月 17 日 专知


自动驾驶车辆的本质是轮式移动机器人,是一个集模式识别、环境感知、规划决策和智能控制等功能于一体的综合系统。人工智能和机器学习领域的进步极大推动了自动驾驶技术的发展。当前主流的机器学习方法分为:监督学习、非监督学习和强化学习3种。强化学习方法更适用于复杂交通场景下自动驾驶系统决策和控制的智能处理,有利于提高自动驾驶的舒适性和安全性。深度学习和强化学习相结合产生的深度强化学习方法成为机器学习领域中的热门研究方向。首先对自动驾驶技术、强化学习方法以及自动驾驶控制架构进行简要介绍,并阐述了强化学习方法的基本原理和研究现状。随后重点阐述了强化学习方法在自动驾驶控制领域的研究历史和现状,并结合北京联合大学智能车研究团队的研究和测试工作介绍了典型的基于强化学习的自动驾驶控制技术应用,讨论了深度强化学习的潜力。最后提出了强化学习方法在自动驾驶控制领域研究和应用时遇到的困难和挑战,包括真实环境下自动驾驶安全性、多智能体强化学习和符合人类驾驶特性的奖励函数设计等。研究有助于深入了解强化学习方法在自动驾驶控制方面的优势和局限性,在应用中也可作为自动驾驶控制系统的设计参考。


http://www.cjig.cn/jig/ch/reader/view_abstract.aspx?file_no=20210103&flag=1


自动驾驶车辆是一个集环境感知、决策规划和 智能控制等功能于一体的综合系统,是智能交通系 统的重要组成部分,也是智能车辆领域研究的热点 和汽车工业增长的新动力(徐友春 等,2001)。自动 驾驶汽车的控制技术是整个自动驾驶系统中的关键 环节,也是国内外广大学者重点研究的领域。自动 驾驶系统一般采用分层结构,其中控制层的功能是 将来自决策和规划层的指令转化为各执行机构的动 作,并控制各执行机构完成相应的动作,以此准确地 跟踪路径并合理地控制速度。


自动驾驶车辆的控制可分为横向控制和纵向控 制,传统的横/ 纵向控制的方法大多需要精确的数学 解析模型,并对受控系统进行精确的数值求解。然 而精度较高的模型一般也比较复杂,参数较多。复 杂的模型也造成了较高的计算代价,使得求解困难, 往往难以保证实时性。随着互联网 + 、大数据和人 工智能的迅速发展,研究人员开始基于机器学习方 法开发智能汽车决策和控制算法,开辟了一条不同 于汽车工程专家的研究思路。


机器学习主要研究计算机如何通过经验或探索 环境来获取知识或优化自身技能,这是当前发展最 快的一个技术领域。越来越多基于机器学习的方法 被应用到自动驾驶系统中来。李德毅院士认为基于 自学习的“驾驶脑”是中国智能车实现对国外弯道 超车的关键所在(李德毅,2015)。2019 年,专业研 发自动驾驶的公司 Waymo 收购了专门研究模仿学 习在自动驾驶中应用的 Latent Logic 公司,这意味着 Waymo 将在机器学习在自动驾驶中的应用领域展 开更加深入的研究和开发。目前,国内的各大 IT 厂商也纷纷开展与传统汽车厂家的合作,共同开 发智能汽车。百度公司自 2014 年启动“百度自动 驾驶汽车”研发计划以来,已经推出了Apollo 自动 驾驶系统, 并于 2016 年取得了加州的自动驾驶牌 照。百度还将自动驾驶汽车结合百度大脑,通过 人工智能技术进一步推动自动驾驶汽车的进步。


机器学习的一个主要类型是强化学习( reinforcement learning,RL) (Kaelbling 等,1996;Bartlett, 2003;Konda 和 Tsitsiklis,2003;Sutton 和 Barto,1998; Sutton,1992;Lillicrap 等,2015;Mnih 等,2015;Silver等,2017)。与监督式学习主要应用于自动驾驶的 感知层不同,强化学习更多应用在决策和控制层。传统控制器一般利用由固定参数组成的先验模型, 当机器人用于复杂环境(例如驾驶)时,传统控制器 无法预见系统必须应对的所有可能情况,而学习型 控制器会利用训练信息来逐步学习其模型(Ostafew 等,2016)。机器学习还可以和传统控制方法相结 合,如学习模型预测控制( model predictive control, MPC)的代价函数,使人们更好地预测车辆的干扰 和行为(Ostafew,2016)。由于自动驾驶控制问题具 有高维度、状态和动作空间连续、非线性等特点,深 度学习虽然具有较强的感知能力,然而却不擅长决 策和控制。强化学习则可以通过不断探索环境来学 习复杂的控制模型。因此,将两者相结合的深度强 化学习(deep reinforcement learning, DRL)可以形成 优势互补,为解决复杂系统的感知决策问题提供了 新的思路。DRL 可以实现端到端( end-to-end)的感 知与控制,具有很强的通用性。DRL 将深度学习的 感知能力和强化学习的决策控制能力相结合,可以 直接根据输入的像素级别的图像(或雷达数据) 进 行控制,更接近人类的思维方式。深度学习和强化 学习的结合使得自动驾驶控制问题得到了更多的解 决方案。


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“RAC” 可以获取《强化学习的自动驾驶控制技术研究进展》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
1

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
58+阅读 · 2021年4月22日
专知会员服务
29+阅读 · 2021年4月12日
专知会员服务
58+阅读 · 2021年3月6日
自动驾驶软件测试技术研究综述
专知会员服务
49+阅读 · 2021年2月19日
专知会员服务
80+阅读 · 2021年1月24日
专知会员服务
81+阅读 · 2020年12月11日
专知会员服务
102+阅读 · 2020年11月27日
专知会员服务
33+阅读 · 2020年11月26日
最新《智能交通系统的深度强化学习》综述论文,22页pdf
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
深度学习技术在自动驾驶中的应用
智能交通技术
25+阅读 · 2019年10月27日
《中国自动驾驶仿真技术研究报告(2019)》介绍
智能交通技术
7+阅读 · 2019年7月8日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
29+阅读 · 2019年7月7日
自动驾驶测试中的场景构建
智能交通技术
7+阅读 · 2019年6月11日
自动驾驶汽车技术路线简介
智能交通技术
14+阅读 · 2019年4月25日
深度学习在自动驾驶感知领域的应用
AI100
11+阅读 · 2019年3月6日
机器视觉技术的农业应用研究进展
科技导报
7+阅读 · 2018年7月24日
李克强:智能车辆运动控制研究综述
厚势
20+阅读 · 2017年10月17日
Arxiv
0+阅读 · 2021年5月1日
Generalization and Regularization in DQN
Arxiv
6+阅读 · 2019年1月30日
Arxiv
8+阅读 · 2018年7月12日
Arxiv
5+阅读 · 2018年5月1日
VIP会员
相关VIP内容
专知会员服务
58+阅读 · 2021年4月22日
专知会员服务
29+阅读 · 2021年4月12日
专知会员服务
58+阅读 · 2021年3月6日
自动驾驶软件测试技术研究综述
专知会员服务
49+阅读 · 2021年2月19日
专知会员服务
80+阅读 · 2021年1月24日
专知会员服务
81+阅读 · 2020年12月11日
专知会员服务
102+阅读 · 2020年11月27日
专知会员服务
33+阅读 · 2020年11月26日
最新《智能交通系统的深度强化学习》综述论文,22页pdf
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
相关资讯
深度学习技术在自动驾驶中的应用
智能交通技术
25+阅读 · 2019年10月27日
《中国自动驾驶仿真技术研究报告(2019)》介绍
智能交通技术
7+阅读 · 2019年7月8日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
29+阅读 · 2019年7月7日
自动驾驶测试中的场景构建
智能交通技术
7+阅读 · 2019年6月11日
自动驾驶汽车技术路线简介
智能交通技术
14+阅读 · 2019年4月25日
深度学习在自动驾驶感知领域的应用
AI100
11+阅读 · 2019年3月6日
机器视觉技术的农业应用研究进展
科技导报
7+阅读 · 2018年7月24日
李克强:智能车辆运动控制研究综述
厚势
20+阅读 · 2017年10月17日
Top
微信扫码咨询专知VIP会员