【ICME2019】出行领域计算机视觉技术，滴滴AI Labs教程，117页PPT

2019 年 7 月 16 日 专知

【导读】2019年7月8日-12日，图像视觉领域的知名会议IEEE国际多媒体与博览会（ICME）在上海召开。滴滴Computer Vision in Transportation讲习班以实践应用为核心，多方面地讲解当前视觉技术在交通领域的应用与原理。在垂直领域找到与技术深度结合的应用场景是当前计算机视觉技术落地的一个重要命题。计算机视觉技术的落地也势必会直接影响我们衣食住行的方方面面。特别在出行领域，计算机视觉技术的应用将会极大提高交通运行效率和安全水平。

第一部分覆盖交通领域视觉应用背后支撑的方法和原理，包括深度学习知识、图像分类以及目标检测等；第二部分主要集中讲在交通领域的应用中所需要的前沿性探索问题：域适应（Domain Adaptation）和轻量级模型(Lightweight Models)；最后一部分讲述了计算机视觉在出行领域的两大应用方向。

第一章

计算机视觉导论

（Introduction to Computer Vision）

讲师：滴滴AI Labs 车正平博士

大纲：

• Computer Vision Basics

• Representation Learning

• Activation Functions

• Neural Network Structures

• Convolution Operators

• Pooling Layers

• Batch Normalization

• Image Classification

• Datasets & Competitions

• Roadmap

• Classification Networks

• Experiments

• Object Detection

• Introduction & Roadmap

• Region-Based Methods

• Region-Free Methods

• Experiments

亮点：在本演讲中，简明扼要地讲述了深度学习时代的视觉技术基础，如表征学习、激活函数、神经网络、卷积操作、池化层和批归一化等入门知识，详细地介绍了图像分类和目标检测的全局路线图和代表性工作，分享了在实践中发现的几个痛点：模型对昂贵的标注数据的依赖性；已有模型无法在新的环境中直接使用；对计算资源的高需求；以及端上能力推广的局限性。

相关阅读：

《密西根大学40页《20年目标检测综述》最新论文，带你全面了解目标检测方法》

车正平博士讲解计算机视觉基础知识

第二章

前沿话题

（Advanced Topics）

讲者：滴滴AI Labs 首席研究员，加拿大carleton University郭玉红教授

大纲

• Domain Adaptation

• Introduction

• Application in Computer Vision

• Domain Adaptation Methods

• Lightweight Models

• Basics

• Inception, Xception *

• SqueezeNet

• MobileNet / MobileNetV2

• ShuffleNet / ShuffleNetV2

亮点：基于前文提出的痛点与挑战，在本演讲中分享了两个前沿话题：Domain Adaptation和Lightweight Models。其中Domain Adaptation旨在解决如何从原始问题学习到的模型能够很好地适应与之不相同的目标问题。而Lightweight Models可以很好地解决模型存储和速度问题，通过构建轻量级模型让深度卷积神经网络保持精度的同时，模型体积更小，占用更少的资源。

郭玉红教授讲解前沿话题

第三章

应用

（Application）

讲者: 滴滴AI Labs沈海峰博士，李广宇博士

大纲

• Driver Identification

• Application

• Overview

• Experiments

• Driving Scenario Understanding

• Vision Perception

• 3D Reconstruction

• Behavior Analysis

亮点：本演讲中举例计算机视觉在交通的两大应用点，司机认证和驾驶场景理解。其中司机认证主要涉及人脸检测和识别技术。沈海峰博士介绍了人脸技术的一些典型应用，特点和挑战；回顾了人脸检测主流技术以及识别主流技术的演进。并且分享了滴滴在NeurIPS2018的论文Virtual Class Enhanced Discriminative Embedding Learning以及WIDER FACE人脸检测竞赛5项单项第一的算法模型。驾驶场景理解是一个涵盖全方面视觉技术的应用话题。李广宇博士从场景中有什么，物体和车之间的关系（距离）以及司机对环境的反应三个角度，即视觉感知、三维重建和行为分析进行讲解。视觉感知简单地讲述了通用视觉和驾驶场景理解视觉技术不同点，分享了行人检测、车辆检测、车道线分割、交通灯检测等应用；三维重建部分深入浅出地介绍了基础知识和语义重建；最后演讲关注于驾驶场景的深度感知与理解。

请关注专知公众号（点击上方蓝色专知关注）

后台回复“DIDICV” 就可以获取《CV in Transportation》的下载链接~

-END-

专 · 知

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎登录www.zhuanzhi.ai，注册登录专知，获取更多AI知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程视频资料和与专家交流咨询！

请加专知小助手微信（扫一扫如下二维码添加），加入专知人工智能主题群，咨询技术商务合作~

专知《深度学习:算法到实战》课程全部完成！550+位同学在学习，现在报名，限时优惠！网易云课堂人工智能畅销榜首位！

点击“阅读原文”，了解报名专知《深度学习:算法到实战》课程

登录查看更多

相关内容

ICME

关注 2

IEEE多媒体与博览会国际会议（ICME）每年有大约1,000名作者和500名参与者参加，这是由四个IEEE协会主办的联盟多媒体会议。它是一个促进交流多媒体最新进展的论坛从电路和系统，通信，计算机和信号处理社区的研究和开发角度来看的技术，系统和应用程序。官网地址：http://dblp.uni-trier.de/db/conf/icmcs/

一份循环神经网络RNNs简明教程，37页ppt

专知会员服务

173+阅读 · 2020年5月6日

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【CVPR 2019 | tutorial】计算机视觉的深度强化学习：Deep Reinforcement Learning for Computer Vision

专知会员服务

55+阅读 · 2019年11月28日

【NLPCC2019 Tutorial】个性化推荐的基础与趋势（Foundations and Trends for Personalized Recommendation）附145页ppt，清华大学张敏老师

专知会员服务

68+阅读 · 2019年11月22日