谷歌最新语义图像分割模型 DeepLab-v3+ 现已开源 | 软件推介

2018 年 3 月 18 日 开源中国 谷歌

#扫描上方二维码进入报名#


Apache-2.0

C/C++ Python

跨平台

Google


Google 研究团队开源在 Tensorflow 中进行语义图像分割(Semantic Image Segmentation)模型 DeepLab-v3+,包括 Google Pixel 2 和 Pixel 2XL 手机上的人像模式(Portrait Mode),以及 YouTube 为影片实时更换背景功能,都是这项技术的应用。



Google 研究软件工程师 Liang-Chieh Chen 以及 Yukun Zhu 表示,语义图像分割的主要目的是为每个像素指定语义标签,例如路、天空、人或是狗等物体,不少的程序需要这样的功能,像是合成浅景深效果(Synthetic Shallow Depth-of-field)效果,应用在手机 Pixel 2 和 Pixel 2XL 上提供的人像模式(Portrait Mode),能自动模糊人物的背景,作出类似单镜头反光相机的景深效果。



另外,在多数摄影 App 都会提供的实时影像分割(Video Segmentation),例如最近 YouTube 发表的新功能,为影片换背景的功能,也是语义影像分割的应用。

DeepLab-v3+ 在 Tensorflow 上进行,使用部署于服务器端的卷积神经网络(CNN)骨干架构,以获取最佳的结果。


除了代码之外,研究团队也同时公开了 Tensorflow 模型训练以及评估程序,以及使用 Pascal VOC 2012 与 Cityscapes 资料集训练的模型。


DeepLab-v3+ 技术是基于三年前的 DeepLab 模型,期间改进了卷积神经网络特征萃取器、物体比例塑造模型以及同化前后内容的技术,再加上进步的模型训练过程,还有软硬件的升级,从 DeepLab-v2 到 DeepLab-v3,直到现在发表的 DeepLab-v3+,效果一代比一代好。


DeepLab-v3+ 是由 DeepLab-v3 扩充而来,研究团队增加了解码器模组,能够细化分割结果,能够更精准的处理物体的边缘,并进一步将深度卷积神经网络应用在空间金字塔池化(Spatial Pyramid Pooling,SPP)和解码器上,大幅提升处理物体大小以及不同长宽比例的能力,最后得到强而有力的语义分割编码解码器网络。



Liang-Chieh Chen 以及 Yukun Zhu 特别提到,随着软硬件的升级,建构在卷积神经网路上的现代语义图像分割功能,可以达到的水准已经远远超过5年前。


详情及源码地址获取:




推荐阅读

从零开始写简易读写分离,不难嘛!

即将发布的 JDK 10 有 109 项新特性

全票通过!百度开源项目 ECharts 首进 Apache 孵化器

50+ 实用的 Docker 工具推荐

使用率下降到 8%,Chrome 87 将完全移除 Flash

点击“阅读原文”查看更多精彩内容

登录查看更多
16

相关内容

语义图像分割:是指像素级地识别图像,即标注出图像中每个像素所属的对象类别。侧重对类型分割识别,如果两个对象是同一类别,则不分割。与之相对应的是实例图像分割,把图像的所有子图都识别分割。
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
28+阅读 · 2020年3月5日
斯坦福&谷歌Jeff Dean最新Nature论文:医疗深度学习技术指南
DL | 语义分割综述
机器学习算法与Python学习
58+阅读 · 2019年3月13日
利用DeepLab在Tensorflow中进行语义图像分割
机器学习研究会
9+阅读 · 2018年3月22日
谷歌开源语义图像分割模型DeepLab-v3+ | 附代码
深度学习人脸检测和识别系统 DFace | 软件推介
开源中国
7+阅读 · 2017年12月9日
10个深度学习软件的安装指南(附代码)
数据派THU
17+阅读 · 2017年11月18日
Learning Dynamic Routing for Semantic Segmentation
Arxiv
8+阅读 · 2020年3月23日
Arxiv
8+阅读 · 2018年5月15日
Arxiv
13+阅读 · 2017年12月5日
VIP会员
相关VIP内容
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
28+阅读 · 2020年3月5日
斯坦福&谷歌Jeff Dean最新Nature论文:医疗深度学习技术指南
相关资讯
DL | 语义分割综述
机器学习算法与Python学习
58+阅读 · 2019年3月13日
利用DeepLab在Tensorflow中进行语义图像分割
机器学习研究会
9+阅读 · 2018年3月22日
谷歌开源语义图像分割模型DeepLab-v3+ | 附代码
深度学习人脸检测和识别系统 DFace | 软件推介
开源中国
7+阅读 · 2017年12月9日
10个深度学习软件的安装指南(附代码)
数据派THU
17+阅读 · 2017年11月18日
Top
微信扫码咨询专知VIP会员