无人驾驶汽车系统入门:深度前馈网络,深度学习的正则化,交通信号识别

2018 年 6 月 2 日 人工智能头条

作者 | 申泽邦(Adam Shan)

兰州大学在读硕士研究生,主攻无人驾驶,深度学习;兰大未来计算研究院无人车团队骨干,在改自己的无人车,参加过很多无人车Hackathon,喜欢极限编程。


在前几十年,神经网络并没有受到人们的重视,直到深度学习的出现,人们利用深度学习解决了不少实际问题(即一些落地性质的商业应用),神经网络才成为学界和工业界关注的一个焦点。本文以尽可能直白,简单的方式介绍深度学习中三种典型的神经网络以及深度学习中的正则化方法。为后面在无人驾驶中的应用做铺垫。


深度学习的能力


近期在学术领域存在这许多批判深度学习的言论(参考Gary Marcus的文章:https://arxiv.org/ftp/arxiv/papers/1801/1801.00631.pdf ),深度学习在一些学者看来并不是通往通用人工智能的道路。但是,作为关注行业应用的研究者和工程师,我们并不需要关注深度学习到底是不是通往最终的通用人工智能的道路,我们只需要知道,深度学习到底能不能够解决我们行业的一些问题(通过传统的软件工程很难解决的问题)?答案是能,正是因为深度学习有着这样的能力,它才成为人工智能研究领域历史上第一次为各大商业公司追逐的技术(以往的人工智能大多是实验室产品,从未吸引巨头的大量资本投入)。商业公司追逐利益,追逐商业化,一项技术能够为业内大量公司热捧,说明其已经具备在某些应用行业商业化,产品化的能力,那么我们首先来了解一下深度学习现在已经具备的“产品力”:


图像识别与分类


传统的计算机视觉技术在处理图像识别问题时往往需要人为设计特征,要识别不同的类别,就要设计不同的特征,要识别猫和狗,就要分别为猫和狗设计特征,而这个过程是非常麻烦的,我们以猫和狗为例:

上图是猫和狗的照片,可以说,光是为猫和狗两个类别的识别设计特征就需要耗费大量的精力,并且还得是“猫狗专家”才能做这件事情。那么,当要识别的类别上升到1000类的时候呢?传统的视觉算法的识别精度将会更低。


深度学习取得的第一个重大的突破就在ImageNet的识别挑战上。


ImageNet是一个拥有1400万张图片的巨大数据集,基于ImageNet数据集,ILSVRC(ImageNet Large Scale Visual Recognition Challenge)挑战赛每年举办一次。


自2012年AlexNet在ILSVRC上以远超第二名的识别率打破当年的记录以后,深度学习在ImageNet数据集上的识别率在近两年取得了一个又一个的突破。到2015年,ResNet的top-5识别率正式超过人类:

目标检测

像素级别的场景分割

视频字幕生成

游戏和棋牌



语音识别,文本生成,黑白影片自动着色,雅尔塔游戏……


深度学习有着极强的表示能力,能够处理复杂的任务,自然,我们需要使用深度学习来解决无人驾驶中一直以来的问题(基于深度学习的计算机视觉,基于深度学习的决策,基于强化学习的决策等等)。下面我们就开始深度学习的相关基础。


深度前馈神经网络——为什么要深?


在第九篇博客的末尾其实我们已经接触了深度前馈神经网络,我们使用一个规模很大的深度前馈网络来解决MNIST手写字识别问题,我们的这个网络取得了