中国科学院自动化研究所&QMUL联合发布了基于 Pytorch 的轻量化行人重识别(person re-identification, reid)开源工具箱 light-reid。不同于已有开源 reid 工具箱往往关注于精度,该工具箱在保证精度的同时,可以一键加速 reid 模型,推理3x、图像搜索20x。应用于该工具箱的部分加速模块已经被 ECCV2020 接收。(注:本文 reid 特指 person reid,即行人重识别)

GitHub:https://github.com/wangguanan/light-reid Paper:https://arxiv.org/abs/2008.06826

————————————————————————————————————————

作者介绍

王贯安,中国科学院自动化研究所博士,英国伦敦玛丽王后学院(Queen Mary University of London,QMUL)访问学者。研究方向为计算机视觉,特别是行人重识别、哈希、生成对抗网络等,目前已发表顶级论文9篇,包括CVPR/ICCV/ECCV/AAAI/IJCAI等。个人主页:https://wangguanan.github.io/

————————————————————————————————————————

什么是reid,如何实现

图:行人重识别(来自于网络)

    简单理解就是,我们需要根据某行人A的图像,在图像候选集中找到该行人A的其他图像。reid 技术在实际场景中有着很重要的作用。reid 技术可以在一个监控系统中,构建行人的运动轨迹,并应用到各种下游任务。
    比如在小区监控系统中,我们在某个时刻锁定犯人A,根据 reid 算法,我们就可以在整个监控系统的中,自动的找出犯人A在整个小区监控中出现的图片,并确定他的运动轨迹,最终辅助警察抓捕。再比如在智慧商业场景中,我们可以根据 reid 算法描绘出每个消费者的商场运动轨迹和区域驻留时间,从而优化客流、辅助商品推荐等。
    reid 算法可以分解为以下3步:

特征提取:给定一个查询图片(query image)和大量的数据库图片(gallery images),提取出它们的语义特征。在这个特征空间,同一个人的图片距离尽可能小,不同人图片距离尽可能大。目前主流的 reid 算法使用深度卷积神经网络(CNN,如 ResNet50)提取特征。 距离计算:得到查询特征(query feature)和数据库特征(gallery features)后,计算查询图片和数据库图片的距离。通常使用欧式(euclidean)、余弦(cosine)距离等。 排序返回:得到距离后,我们可以使用排序算法对样本进行排序,通过卡距离阈值或者K近邻的方法,返回最终样本。一般使用快速排序算法(QuickSort),其复杂度是 O(NlogN),N 为数据库图片数量。

什么是light-reid

图:light-reid 框架

    light-reid 框架如上图所示, 一共分为3个模块,分别是 light-model (轻量化模型),light-feature(轻量化特征)以及 light-search(轻量化搜索):
  • light-model (轻量化模型):轻量化模型模块通过使用模型蒸馏的方法,学习到性能较好、计算量较小的 reid 模型。实验结果表明,该模块可以对特征提取加速3x(resnet18 v.s. resnet50),且精度(mAP)降低控制在 2% 左右。
  • light-feature (轻量化特征):light-feature 通过对实值(real-value)特征进行二值量化(binarization),降低存储空间并加速距离计算。实验结果表明,相比 float64 型实值编码,二值编码存储空间降低64倍,距离计算加速4x,精度损失几乎为零。
  • light-search (轻量化搜索):light-search 通过我们在ECCV2020上提出的层级搜索策略,更多的利用短码进行快速粗排,仅对少量候选样本进行精排序。实验结果表明,该方法可以加速搜索5x左右,精度降低控制在2%。
  • light-reid(轻量化行人重识别):以上三个模块构成了我们的轻量化行人重识别,同时使用,可对特征提取加速3x,对搜索加速20x,精度损失仅在4%左右。

总结

    reid 社区目前已经多个工具箱以及 baseline,它们极大的促进了 reid 技术的发展。但美中不足的是,它们主要关注精度,却忽视了速度这个重要指标。我们提出的 light-reid 工具箱在关注精度的同时,提供了一键式的加速算法,提高推理以及搜索速度。结合已有 reid 工具箱,我们的 light-reid 完善了 reid 工具箱的生态,从精度,到速度,再到工业应用,形成良好闭环。

Author:https://wangguanan.github.io/ GitHub:https://github.com/wangguanan/light-reid Paper:https://arxiv.org/abs/2008.06826

成为VIP会员查看完整内容
15

相关内容

专知会员服务
78+阅读 · 2020年10月2日
专知会员服务
37+阅读 · 2020年8月19日
少标签数据学习,54页ppt
专知会员服务
194+阅读 · 2020年5月22日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
基于深度学习的行人重识别研究进展,自动化学报
专知会员服务
38+阅读 · 2019年12月5日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
数据集|更大的行人重识别测试集 Market-1501+500k
极市平台
26+阅读 · 2019年1月4日
通过时空模型迁移学习的无监督的跨数据集行人重新识别
统计学习与视觉计算组
8+阅读 · 2018年10月23日
从人脸识别到行人重识别,下一个风口
计算机视觉战队
13+阅读 · 2017年11月24日
ICCV2017 论文解读:基于图像检索的行人重识别
极市平台
7+阅读 · 2017年11月15日
VIP会员
相关VIP内容
专知会员服务
78+阅读 · 2020年10月2日
专知会员服务
37+阅读 · 2020年8月19日
少标签数据学习,54页ppt
专知会员服务
194+阅读 · 2020年5月22日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
基于深度学习的行人重识别研究进展,自动化学报
专知会员服务
38+阅读 · 2019年12月5日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
相关资讯
微信扫码咨询专知VIP会员