【优博微展2019】段岳圻:非监督二值视觉特征学习

2019 年 10 月 4 日 清华大学研究生教育


非监督二值视觉特征学习


Unsupervised Binary Visual Representation Learning


作       者:段岳圻

指导教师:周杰

培养院系:自动化系

学       科:控制科学与工程

读博感言:时间花在哪里,进步就在哪里


研究背景/选题意义/研究价值


视觉是智能体从外界环境感知信息的重要基础,特征提取在如识别、匹配、搜索等多项计算机视觉应用中扮演着关键的角色。随着大数据时代的到来以及计算设备的不断发展,特征学习方法逐渐超越手工特征设计方法,成为了研究的主流。现有研究大多关注监督实值特征学习方法,但监督学习对标注数据依赖性强,人力、物力成本开销大;高维实值特征存储、匹配效率低,对计算设备能力要求高,在智能机器人及移动设备等应用中存在瓶颈。本文对非监督二值视觉特征学习方法展开研究,采用非监督学习的方式充分利用大量未标注原始训练数据,并使用紧致二值特征替代高维实值特征进行高效表示,有效克服上述瓶颈。


主要研究内容


对于二值特征,二值化是以量化信息损失为代价增强特征高效性的重要步骤。本文设计了非监督多量化深度网络以学习数据自适应的二值化方法。相对于手工设计阈值的方法,多量化能够利用每位特征的整体分布,从而得到更为精准的二值化结果。


图1 多量化非监督二值特征


现有方法未挖掘二值特征位与位的关系,导致每位特征包含信息量较少,大量特征位于量化阈值边界,表达精准度低。本文对码相关非监督二值特征学习方法展开研究,利用特征内部其他位提供重要的补充信息,增强二值特征的精准性。


图2 码相关非监督二值特征


主要创新点


1. 针对量化信息损失大的问题,提出多量化非监督二值特征学习方法。该方法设计了深度K-自编码网络,采用多量化的方式学习数据适应的二值化过程,最小化二值特征的量化信息损失。该方法进一步引入了特征维度间竞争以获得更优的码长分配,采用更多的码字描述信息量丰富的维度,对数据进行充分的描述。


2. 针对视觉表达精度低的问题,提出码相关非监督二值特征学习方法。该方法首先设计了上下文联系的二值特征,并进一步对深度图二值特征展开研究,采用有向无环图替代向量进行特征表示,设计深度强化学习算法挖掘图结构,增强特征的可靠性。


3. 针对特征旋转鲁棒差的问题,提出旋转不变非监督二值特征学习方法。该方法设计了旋转二值模式算子,描述图像的角度信息,并联合学习图像的旋转角度及投影矩阵,获得旋转不变二值特征。


代表性创新成果


1. Yueqi Duan, Jiwen Lu, Ziwei Wang and Jie Zhou, Learning Deep Binary Descriptor with Multi-Quantization, TPAMI, 2019, 41(8):1924-1938.


2. Yueqi Duan, Jiwen Lu, Jianjiang Feng and Jie Zhou, Context-Aware Local Binary Feature Learning for Face Recognition, TPAMI, 2018, 40(5):1139-1153.


3. Yueqi Duan, Jiwen Lu, Jianjiang Feng and Jie Zhou, Learning Rotation-Invariant Local Binary Descriptor, TIP, 2017, 26(8):3636-3651.


4. Yueqi Duan, Ziwei Wang, Jiwen Lu, Xudong Lin and Jie Zhou, GraphBit: Bitwise Interaction Mining via Deep Reinforcement Learning, CVPR, 2018, 8270-8279.


5. Yueqi Duan, Jiwen Lu, Ziwei Wang, Jianjiang Feng and Jie Zhou, Learning Deep Binary Descriptor with Multi-Quantization. CVPR, 2017, 4857-4866.


作者:段岳圻
图片:段岳圻
编辑: 清华大学研究生院  吴佳瑛  李文



转载须经作者同意授权


登录查看更多
1

相关内容

最新《多任务学习》综述,39页pdf
专知会员服务
258+阅读 · 2020年7月10日
【CVPR2020】跨模态哈希的无监督知识蒸馏
专知会员服务
59+阅读 · 2020年6月25日
基于视觉的三维重建关键技术研究综述
专知会员服务
154+阅读 · 2020年5月1日
【SIGIR2020】学习词项区分性,Learning Term Discrimination
专知会员服务
15+阅读 · 2020年4月28日
基于深度学习的多标签生成研究进展
专知会员服务
140+阅读 · 2020年4月25日
专知会员服务
41+阅读 · 2020年2月20日
近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码
判别特征的学习方法用于人脸识别(文末源码)
计算机视觉战队
7+阅读 · 2019年3月28日
【优博微展2018】刘昊:基于深度神经网络的人脸关键点检测
清华大学研究生教育
32+阅读 · 2018年12月1日
【泡泡图灵智库】密集相关的自监督视觉描述学习(RAL)
泡泡机器人SLAM
11+阅读 · 2018年10月6日
【重磅】自适应无监督学习的特征提取方法
中国自动化学会
7+阅读 · 2018年2月6日
深度判别和共享特征学习的图像分类
计算机视觉战队
6+阅读 · 2017年9月27日
Learning Discriminative Model Prediction for Tracking
Arxiv
9+阅读 · 2018年3月28日
Arxiv
9+阅读 · 2018年1月4日
VIP会员
相关VIP内容
最新《多任务学习》综述,39页pdf
专知会员服务
258+阅读 · 2020年7月10日
【CVPR2020】跨模态哈希的无监督知识蒸馏
专知会员服务
59+阅读 · 2020年6月25日
基于视觉的三维重建关键技术研究综述
专知会员服务
154+阅读 · 2020年5月1日
【SIGIR2020】学习词项区分性,Learning Term Discrimination
专知会员服务
15+阅读 · 2020年4月28日
基于深度学习的多标签生成研究进展
专知会员服务
140+阅读 · 2020年4月25日
专知会员服务
41+阅读 · 2020年2月20日
近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码
相关资讯
Top
微信扫码咨询专知VIP会员