【特征可视化】神经网络是怎样理解图片的?谷歌大脑研究员详解特征可视化

2017 年 11 月 9 日 GAN生成式对抗网络
来源:量子位

我们总是听说人工智能在图像识别上超越了人类,刷脸也逐渐成了生活中司空见惯的事儿。这些图像识别技术背后,通常是深度神经网络。

不过,神经网络究竟是怎样认识图像的?

特征可视化能够告诉我们神经网络在图片中寻找的是什么

特征可视化这个强大的工具,就能帮我们理解神经网络内部的世界,知道它们的工作原理。

谷歌研究员Christopher Olah、Alexander Mordvintsev和Ludwig Schubert今天在distill博客上发文深度探索了特征可视化这个问题,并顺便介绍了一些新trick。

distill.pub是Olah等人今年3月推出的机器学习网站,会不定期发表文章,以可视化、可交互的方式来展示机器学习研究成果。

原文地址:https://distill.pub/2017/feature-visualization/。其中包含大量可交互的示例图片。

下面,量子位对这篇文章做个简要的介绍:

在2015年谷歌推出的DeepDream基础上,经过AI研究界后来的共同努力,现在,计算机视觉模型中每一层所检测的东西都可以可视化出来。经过在一层层神经网络中的传递,会逐渐对图片进行抽象:先探测边缘,然后用这些边缘来检测纹理,再用纹理检测模式,用模式检测物体的部分……

上面是ImageNet训练的GoogLeNet的特征可视化图,我们可以从中看出它的每一层是如何对图片进行抽象的。

在神经网络处理图像的过程中,单个的神经元是不能理解任何东西的,它们需要协作。所以,我们也需要理解它们彼此之间如何交互。

通过在神经元之间插值,我们可以更好地理解他们是如何彼此交互的。下图就展示了两个神经元是如何共同表示图像的。

Distill原文中的这个例子,能够动手探索不同神经元组合在一起会得到什么结果。

当然,这篇文章还介绍了一些特征可视化的trick。

在进行特征可视化时,得到的结果通常会布满噪点和无意义的高频图案。这些高频图案似乎和strided convolution或者池化关系密切。

反向传播时,每次strided convolution或池化都会在梯度幅值上创建棋盘格图案

我们想更好地理解神经网络模型是如何工作的,就要避开这些高频图案。这时所用的方法是进行预先规则化,或者说约束。改变梯度也是一种方法,这种优化方法称为预处理(preconditioning)。

当然,了解神经网络内部的工作原理,也是增强人工智能可解释性的一种途径,而特征可视化正是其中一个很有潜力的研究方向,谷歌的几位研究员将其视为帮人类理解神经网络的一个基础模块,可以与其他工具结合使用。

推荐对此感兴趣的读者去阅读:

distill原文:
https://distill.pub/2017/feature-visualization/

GoogLeNet所有通道的可视化:
https://distill.pub/2017/feature-visualization/appendix/

高质量延伸阅读

☞   【最详尽的GAN介绍】王飞跃等:生成式对抗网络 GAN 的研究进展与展望

☞  【智能自动化学科前沿讲习班第1期】王飞跃教授:生成式对抗网络GAN的研究进展与展望

☞  【智能自动化学科前沿讲习班第1期】王坤峰副研究员:GAN与平行视觉

☞  【重磅】平行将成为一种常态:从SimGAN获得CVPR 2017最佳论文奖说起

☞  【平行讲坛】平行图像:图像生成的一个新型理论框架

☞  【神经特征可视化】GoogleNet是怎么理解图像的?谷歌大神教你读懂「神经特征可视化」

☞  【NVIDIA 论文】用 GAN 生成高清图像 | ICLR 2018

☞  【Facebook最新对抗学习研究】无需「平行语料库」完成「无监督」机器翻译

☞  【迄今最真实的GAN】英伟达渐进增大方式训练GAN,生成前所未有高清图像

☞  【ICCV 2017】训练GAN的16个技巧,2400+星(PPT)

登录查看更多
3

相关内容

人工神经网络(Artificial Neural Network,即ANN ),是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型,按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。 最近十多年来,人工神经网络的研究工作不断深入,已经取得了很大的进展,其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题,表现出了良好的智能特性。
最新《深度多模态数据分析》综述论文,26页pdf
专知会员服务
295+阅读 · 2020年6月16日
【中科院自动化所】视觉对抗样本生成技术概述
专知会员服务
35+阅读 · 2020年4月15日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
347+阅读 · 2020年2月15日
PyTorch模型训练特征图可视化(TensorboardX)
极市平台
33+阅读 · 2019年6月29日
40 行 Python 代码,实现卷积特征可视化
Python开发者
3+阅读 · 2019年2月13日
40行Python代码,实现卷积特征可视化
机器之心
5+阅读 · 2019年1月31日
什么是深度学习的卷积?
论智
18+阅读 · 2018年8月14日
【教程】可视化CapsNet,详解Hinton等人提出的胶囊概念与原理
GAN生成式对抗网络
8+阅读 · 2018年4月11日
神经网络可解释性最新进展
专知
18+阅读 · 2018年3月10日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
干货 | 史上最好记的神经网络结构速记表(下)
AI科技评论
7+阅读 · 2017年10月21日
Interpretable CNNs for Object Classification
Arxiv
20+阅读 · 2020年3月12日
On Feature Normalization and Data Augmentation
Arxiv
14+阅读 · 2020年2月25日
Next Item Recommendation with Self-Attention
Arxiv
5+阅读 · 2018年8月25日
Arxiv
3+阅读 · 2018年1月10日
Arxiv
3+阅读 · 2017年7月6日
VIP会员
相关资讯
PyTorch模型训练特征图可视化(TensorboardX)
极市平台
33+阅读 · 2019年6月29日
40 行 Python 代码,实现卷积特征可视化
Python开发者
3+阅读 · 2019年2月13日
40行Python代码,实现卷积特征可视化
机器之心
5+阅读 · 2019年1月31日
什么是深度学习的卷积?
论智
18+阅读 · 2018年8月14日
【教程】可视化CapsNet,详解Hinton等人提出的胶囊概念与原理
GAN生成式对抗网络
8+阅读 · 2018年4月11日
神经网络可解释性最新进展
专知
18+阅读 · 2018年3月10日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
干货 | 史上最好记的神经网络结构速记表(下)
AI科技评论
7+阅读 · 2017年10月21日
Top
微信扫码咨询专知VIP会员