20分钟教会车道保持功能！Wayve 公司的强化学习算法有点牛 - 专知

会员服务 ·

0

20分钟教会车道保持功能！Wayve 公司的强化学习算法有点牛

2018 年 8 月 1 日 新智驾

文 | 大壮旅

来自新智驾（AI-Drive）的报道

新智驾按：让AI 学会控制一辆汽车沿着道路标线行驶到底要花多久？答案是 20 分钟。鉴于许多司机花很长时间都搞不清如何开车走直线，这样的成绩确实令人惊叹。

掌握这项“技能”的是一家名为 Wayve 的英国公司，Wayve的班底都是来自剑桥大学工程学院的大牛。他们能完成这项壮举主要靠的是“强化学习”（reinforcement learning）算法。Wayve 公司在一篇博文上表示，只需一位安全司机配合，他们的算法在 15-20 分钟内就能教会一辆车沿着道路标线行驶。

所谓的强化学习又称为再励学习、评价学习，是一种重要的机器学习方法，在智能控制机器人及分析预测等领域有许多应用。此前，就有许多公司就展现过这项技术的高效，最好的例子就是 DeepMind 旗下横扫人类棋手的 AlphaGo 和 OpenAI 旗下迅速进步的 Dota 2 AI 机器人（每天训练量相当于人类选手 180 天）。

不可否认的是，让 AI 在复杂的棋类和即时战略类游戏中击败人类，已经让人惊掉下巴了，而在短时间内教会一辆车如何自我控制更是让人惊叹。

Wayve 的团队成员将车辆学习过程的视频上传到了公司的 YouTube 频道上，他们强调，这是世界上第一个将“强化学习带入自动驾驶汽车的范例”。

从视频我们可以看到，最初车辆会像婴儿一样蹒跚学步，在路上蜿蜒前行，但当车辆开始偏离标线，安全驾驶员就会及时介入，将车辆拉回原来的轨道。这样一来，车载算法就知道自己犯了错误，而如果算法长时间不犯错，它们还会拿到奖励的“糖豆”。

除了强化学习，Wayve 还用到了“深度卷积神经网络”，它能接收单图片输入，只靠一块车载 GPU 就能完成数据处理。与其他自动驾驶汽车不同，Wayve 的改装版雷诺小车不需要“海量模型、武装到牙齿的传感器和无穷无尽的数据”，它只需秉承 Wayve 的原则，使用“一个聪明的训练程序，就能快速和高效的完成学习任务。”

今年 5 月份，该团队还参加了 TechCrunch 大会，该公司的联合创始人 Amar Shah 当时介绍：“我们想赋予自动驾驶汽车的是更棒的大脑，而不是更多的硬件。”

“下一步，我们的任务就是扩展这项技术，以应对更多更复杂的驾驶任务，毕竟现在 AI 只不过学会了车道保持这项功能而已。未来，我们希望这套系统能驱动车辆识别交通灯，在环形道路和十字路口应对自如。”Amar Shah 解释道。【完】

推荐阅读：

MIT开发MapLite系统，让自动驾驶汽车深入没有3D地图的乡间小路

最新「大咖Live」预告：

8月4日早上10点，禾多科技产品总监毛涛，将为我们讲解智能代客泊车的现状和未来。扫码进入，等你来听。

「大咖Live」往期嘉宾（部分）：图灵奖得主门生、OUERS 谭章熹；Roadstar.ai首席科学家周光；宽凳科技CEO、前百度副总裁刘骏；煜炜光学首席技术专家张石；黑芝麻科技CEO 单记章等。（音频内容皆已上线，扫码进入）

我们将继续每周邀请一位一线从业者带来项目实践过程中的方法和思路，为智能驾驶从业者与投资人、分析师提供行业参考。另，视觉技术专题研报也将在8月放出，新智驾年度会员可免费查阅，敬请期待。

登录查看更多

1

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

多智能体深度强化学习的若干关键科学问题

多智能体深度强化学习的若干关键科学问题

专知会员服务

174+阅读 · 2020年5月24日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

112+阅读 · 2020年5月18日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

263+阅读 · 2020年4月19日

【干货书】实战推荐系统，Practical Recommender Systems，432页pdf

【干货书】实战推荐系统，Practical Recommender Systems，432页pdf

专知会员服务

176+阅读 · 2020年4月17日

深度神经网络实时物联网图像处理，241页pdf

深度神经网络实时物联网图像处理，241页pdf

专知会员服务

76+阅读 · 2020年3月15日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

277+阅读 · 2020年3月10日

DeepMind科学家Trask《Grokking Deep Learning》图书及代码, 带你无障碍深度学习，高中数学OK

DeepMind科学家Trask《Grokking Deep Learning》图书及代码, 带你无障碍深度学习，高中数学OK

专知会员服务

91+阅读 · 2020年2月29日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

169+阅读 · 2020年2月8日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

176+阅读 · 2020年1月17日

【强化学习】深度强化学习初学者指南

【强化学习】深度强化学习初学者指南

专知会员服务

178+阅读 · 2019年12月14日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

29+阅读 · 2019年7月7日

如何得到稳定可靠的强化学习算法？微软两篇顶会论文带来安全的平滑演进

如何得到稳定可靠的强化学习算法？微软两篇顶会论文带来安全的平滑演进

AI科技评论

3+阅读 · 2019年6月15日

快速上手深度强化学习？学会TensorForce就够了

快速上手深度强化学习？学会TensorForce就够了

新智元

6+阅读 · 2019年3月27日

教程 | 如何在Unity环境中用强化学习训练Donkey Car

教程 | 如何在Unity环境中用强化学习训练Donkey Car

论智

24+阅读 · 2018年9月13日

人工智能迎来寒冬，自动驾驶汽车发展受阻

人工智能迎来寒冬，自动驾驶汽车发展受阻

CSDN

3+阅读 · 2018年8月12日

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

极市平台

3+阅读 · 2018年4月11日

前沿 | 没有地图也能导航：DeepMind展示全新AI导航技术

前沿 | 没有地图也能导航：DeepMind展示全新AI导航技术

机器之心

5+阅读 · 2018年4月4日

“黑”掉自动驾驶汽车，只要给路标涂个大花脸

“黑”掉自动驾驶汽车，只要给路标涂个大花脸

宅客频道

4+阅读 · 2017年8月9日

无人驾驶汽车

无人驾驶汽车

劲说

5+阅读 · 2016年8月26日

Learning in the Frequency Domain

Learning in the Frequency Domain

Arxiv

11+阅读 · 2020年3月12日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning

Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning

Arxiv

5+阅读 · 2019年3月25日

Learn What Not to Learn: Action Elimination with Deep Reinforcement Learning

Learn What Not to Learn: Action Elimination with Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年9月6日

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

Arxiv

11+阅读 · 2018年7月12日

The Matrix Calculus You Need For Deep Learning

The Matrix Calculus You Need For Deep Learning

Arxiv

12+阅读 · 2018年7月2日

Do deep reinforcement learning agents model intentions?

Arxiv

5+阅读 · 2018年5月21日

When and Why are Pre-trained Word Embeddings Useful for Neural Machine Translation?

Arxiv

3+阅读 · 2018年4月18日

Sim-to-Real Optimization of Complex Real World Mobile Network with Imperfect Information via Deep Reinforcement Learning from Self-play

Arxiv

4+阅读 · 2018年4月17日

Topic Compositional Neural Language Model

Arxiv

5+阅读 · 2018年2月26日

VIP会员

相关主题

强化学习算法

自动驾驶汽车

相关VIP内容

多智能体深度强化学习的若干关键科学问题

多智能体深度强化学习的若干关键科学问题

专知会员服务

174+阅读 · 2020年5月24日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

112+阅读 · 2020年5月18日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

263+阅读 · 2020年4月19日

【干货书】实战推荐系统，Practical Recommender Systems，432页pdf

【干货书】实战推荐系统，Practical Recommender Systems，432页pdf

专知会员服务

176+阅读 · 2020年4月17日

深度神经网络实时物联网图像处理，241页pdf

深度神经网络实时物联网图像处理，241页pdf

专知会员服务

76+阅读 · 2020年3月15日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

277+阅读 · 2020年3月10日

DeepMind科学家Trask《Grokking Deep Learning》图书及代码, 带你无障碍深度学习，高中数学OK

DeepMind科学家Trask《Grokking Deep Learning》图书及代码, 带你无障碍深度学习，高中数学OK

专知会员服务

91+阅读 · 2020年2月29日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

169+阅读 · 2020年2月8日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

176+阅读 · 2020年1月17日

【强化学习】深度强化学习初学者指南

【强化学习】深度强化学习初学者指南

专知会员服务

178+阅读 · 2019年12月14日

热门VIP内容

相关资讯

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

29+阅读 · 2019年7月7日

如何得到稳定可靠的强化学习算法？微软两篇顶会论文带来安全的平滑演进

如何得到稳定可靠的强化学习算法？微软两篇顶会论文带来安全的平滑演进

AI科技评论

3+阅读 · 2019年6月15日

快速上手深度强化学习？学会TensorForce就够了

快速上手深度强化学习？学会TensorForce就够了

新智元

6+阅读 · 2019年3月27日

教程 | 如何在Unity环境中用强化学习训练Donkey Car

教程 | 如何在Unity环境中用强化学习训练Donkey Car

论智

24+阅读 · 2018年9月13日

人工智能迎来寒冬，自动驾驶汽车发展受阻

人工智能迎来寒冬，自动驾驶汽车发展受阻

CSDN

3+阅读 · 2018年8月12日

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

极市平台

3+阅读 · 2018年4月11日

前沿 | 没有地图也能导航：DeepMind展示全新AI导航技术

前沿 | 没有地图也能导航：DeepMind展示全新AI导航技术

机器之心

5+阅读 · 2018年4月4日

“黑”掉自动驾驶汽车，只要给路标涂个大花脸

“黑”掉自动驾驶汽车，只要给路标涂个大花脸

宅客频道

4+阅读 · 2017年8月9日

无人驾驶汽车

无人驾驶汽车

劲说

5+阅读 · 2016年8月26日

相关论文

Learning in the Frequency Domain

Learning in the Frequency Domain

Arxiv

11+阅读 · 2020年3月12日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning

Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning

Arxiv

5+阅读 · 2019年3月25日

Learn What Not to Learn: Action Elimination with Deep Reinforcement Learning

Learn What Not to Learn: Action Elimination with Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年9月6日

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

Arxiv

11+阅读 · 2018年7月12日

The Matrix Calculus You Need For Deep Learning

The Matrix Calculus You Need For Deep Learning

Arxiv

12+阅读 · 2018年7月2日

Do deep reinforcement learning agents model intentions?

Arxiv

5+阅读 · 2018年5月21日

When and Why are Pre-trained Word Embeddings Useful for Neural Machine Translation?

Arxiv

3+阅读 · 2018年4月18日

Sim-to-Real Optimization of Complex Real World Mobile Network with Imperfect Information via Deep Reinforcement Learning from Self-play

Arxiv

4+阅读 · 2018年4月17日

Topic Compositional Neural Language Model

Arxiv

5+阅读 · 2018年2月26日

大家都在搜

大型语言模型

伯克利博士论文

图与推荐指南针

最受欢迎动物书系列之“红皮书”

微信扫码咨询专知VIP会员