**本文的主要研究课题是自动驾驶的战术决策。**自动驾驶汽车必须能够处理一系列不同的环境和交通情况,这使得手动指定每个可能的场景的合适行为变得困难。因此,本文考虑基于学习的策略,介绍了不同的基于强化学习的方法。基于深度Q网络(Deep Q-Network, DQN)算法,提出一种通用决策智能体。经过少量修改,该方法可以适用于不同的驾驶环境,并在多种高速公路和交叉路口的仿真场景中得到了验证。通过引入更多的领域知识,以蒙特卡洛树搜索和强化学习的形式将规划和学习相结合,可以获得样本效率更高的智能体。在不同的高速公路场景中,组合方法优于单独使用基于规划或基于学习的策略,同时所需的训练样本比DQN方法少一个数量级。

许多基于学习的方法的一个缺点是它们会创建黑箱解决方案,这并不表明智能体决策的置信度。因此,引入集成分位数网络(Ensemble Quantile Networks, EQN)方法,将分布式强化学习与集成方法相结合,以提供每个决策的偶然不确定性和认知不确定性的估计。结果表明,EQN方法可以在不同的遮挡交叉路口场景中平衡风险和时间效率,同时还可以识别智能体未经过训练的情况。因此,智能体可以避免在训练分布之外做出毫无根据的、有潜在危险的决定。最后,本文介绍了一种神经网络架构,该架构对周围车辆列出的顺序排列是不变的。这种架构通过周围车辆数量的阶乘来提高智能体的采样效率。

https://research.chalmers.se/publication/526543/file/526543_Fulltext.pdf

成为VIP会员查看完整内容
54

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【CMU博士论文】强化学习泛化性与效率研究,206页pdf
专知会员服务
67+阅读 · 2023年2月23日
【博士论文】鲁棒深度学习自动驾驶,160页pdf
专知会员服务
39+阅读 · 2022年11月17日
【博士论文】多任务学习视觉场景理解,140页pdf
专知会员服务
88+阅读 · 2022年4月5日
【CMU博士论文Wen Sun】强化学习的泛化性与效率,206页pdf
专知会员服务
89+阅读 · 2020年9月28日
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
124+阅读 · 2020年8月27日
DAI2020 SMARTS 自动驾驶挑战赛(深度强化学习)
深度强化学习实验室
15+阅读 · 2020年8月15日
强化学习扫盲贴:从Q-learning到DQN
夕小瑶的卖萌屋
52+阅读 · 2019年10月13日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
44+阅读 · 2009年12月31日
国家自然科学基金
3+阅读 · 2008年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
Adversarial Transfer Learning
Arxiv
12+阅读 · 2018年12月6日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
44+阅读 · 2009年12月31日
国家自然科学基金
3+阅读 · 2008年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员