华科开源多目标跟踪（MOT）实时新SOTA：FairMOT - 专知

会员服务 ·

0

华科开源多目标跟踪（MOT）实时新SOTA：FairMOT

2020 年 4 月 9 日 极市平台

加入极市专业CV交流群，与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流！

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流。关注极市平台公众号，回复加群，立刻申请入群~

本文授权转载知乎作者黄飘，https://zhuanlan.zhihu.com/p/126558285，未经允许，不得二次转载。

前言

又开源了一篇MOT的新SOTA，也是实时的，也是CenterNet为底层的，估计是看到CenterTrack开源了。emmm....看来我近期看的几篇都在今年某顶会扎堆了，噗。这里我还是把这篇文章给介绍一下吧，有意思的是其中的大部分论点我都在之前的博客([2]、[3])说过了。

FairMOT

论文题目：A Simple Baseline for Multi-Object Tracking
作者团队：华科&微软亚研院
备注：MOT15~20(private)：59.0、68.7、67.5、58.7 MOTA
论文链接：https://arxiv.org/abs/2004.01888

代码链接：https://github.com/ifzhang/FairMOT

这篇论文的立意是两部分，一个是类似于CenterTrack的基于CenterNet的联合检测和跟踪的框架，一个是类似于JDE，但是却又不同的，探讨了检测框架与ReID特征任务的集成问题。

作者称这类框架为one-shot MOT框架，论文一开始作者讨论了检测框架和ReID任务的关系：

作者的意思是anchor-based的检测框架中存在anchor和特征的不对齐问题，所以这方面不如anchor-free框架，emmm...指出的问题的确是对的，不过详细的讨论建议各位看看我之前对这个问题的详细讨论[3] [4]。作者因为这个问题而选择了anchor-free算法——CenterNet，不过其用法并不是类似于CenterTrack[2]中采取的类似于D&T的孪生联合方式，而是采用的Tracktor++的方式。

我们知道原始的anchor-free框架的大多数backbone都是采用了骨骼关键点中的hourglass结构：

后面我会单独开一个Re-ID和MOT的专题，这里呢作者就谈到了Re-ID网络中典型的多尺度问题，所以就提出要将hourglass结构改成上图中的多尺度融合的形式。最后通过两个分支完成了检测和Re-ID任务的集成，那么接下来的部分就是如何训练。

在训练部分呢，同样地，考虑到正负样本不均衡问题，作者采用了focal loss的形式：

其中M(x,y)表示的是heatmap在(x,y)处存在目标的概率，而对于box size和offset则采用L1 loss：

最后对于Re-ID分支而言，作者采用了identification式的分类框架，这里面的L就是不同的ID的one-hot表示，p就是网络预测的分类置信度。

在实验部分，作者先是通过实验证明anchor-free的框架比anchor-based框架更适合reid：

紧接着论证了多尺度融合框架对于Re-ID的影响：

的确，从特征空间来讲，各ID的特征距离更大了。而对于Re-ID的特征维度，作者通过实验表明128维即可，这里我就不细说了。最后放一下结果，下面都是private赛道的：

我最近是不是有点高产似。。。

参考资源

[1] A Simple Baseline for Multi-Object Tracking

[2] https://zhuanlan.zhihu.com/p/125395219

[3] https://zhuanlan.zhihu.com/p/114700229

[4] https://zhuanlan.zhihu.com/p/126359766

-END-

*延伸阅读

极市独家福利

40万奖金的AI移动应用大赛，参赛就有奖，入围还有额外奖励

添加极市小助手微信（ID : cv-mart），备注：研究方向-姓名-学校/公司-城市（如：AI移动应用-小极-北大-深圳），即可申请加入AI移动应用极市技术交流群，更有每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、行业技术交流，一起来让思想之光照的更远吧~

△长按添加极市小助手

△长按关注极市平台，获取最新CV干货

觉得有用麻烦给个在看

登录查看更多

1

相关内容

多目标跟踪

多目标跟踪

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

专知会员服务

44+阅读 · 2020年6月30日

【CMU】基于图神经网络的联合检测与多目标跟踪

【CMU】基于图神经网络的联合检测与多目标跟踪

专知会员服务

59+阅读 · 2020年6月24日

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

专知会员服务

51+阅读 · 2020年5月28日

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

专知会员服务

33+阅读 · 2020年5月12日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【CVPR2020-谷歌】多目标(车辆)跟踪与检测框架 RetinaTrack

【CVPR2020-谷歌】多目标(车辆)跟踪与检测框架 RetinaTrack

专知会员服务

45+阅读 · 2020年4月10日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

FB大牛撰文推介，PySlowFast！Facebook开源视频理解前沿算法代码库，视频SOTA技术全在这了！

FB大牛撰文推介，PySlowFast！Facebook开源视频理解前沿算法代码库，视频SOTA技术全在这了！

专知会员服务

65+阅读 · 2020年1月6日

深度学习视频中多目标跟踪：论文综述

深度学习视频中多目标跟踪：论文综述

专知会员服务

94+阅读 · 2019年10月13日

【文献综述】视频多目标跟踪中的深度学习方法，38页pdf

【文献综述】视频多目标跟踪中的深度学习方法，38页pdf

专知会员服务

53+阅读 · 2019年8月1日

CVPR2019通用目标检测

CVPR2019通用目标检测

极市平台

8+阅读 · 2019年8月6日

CenterNet：目标即点（代码已开源）

CenterNet：目标即点（代码已开源）

极市平台

25+阅读 · 2019年5月24日

从Densebox到Dubox：更快、性能更优、更易部署的anchor-free目标检测

从Densebox到Dubox：更快、性能更优、更易部署的anchor-free目标检测

极市平台

13+阅读 · 2019年5月14日

吊打YOLOv3！普林斯顿大学提出：CornerNet-Lite，基于关键点的实时且精度高的目标检测算法，已开源！

吊打YOLOv3！普林斯顿大学提出：CornerNet-Lite，基于关键点的实时且精度高的目标检测算法，已开源！

极市平台

30+阅读 · 2019年4月20日

多目标跟踪：SORT和Deep SORT

多目标跟踪：SORT和Deep SORT

极市平台

47+阅读 · 2019年3月18日

【学界】CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

【学界】CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

GAN生成式对抗网络

12+阅读 · 2019年3月5日

CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

极市平台

9+阅读 · 2019年3月5日

CVPR2019 | 全景分割：Attention-guided Unified Network

CVPR2019 | 全景分割：Attention-guided Unified Network

极市平台

9+阅读 · 2019年3月3日

ECCV 2018 | 行人检测全新视角：从人体中轴线标注出发

ECCV 2018 | 行人检测全新视角：从人体中轴线标注出发

极市平台

6+阅读 · 2018年9月7日

ECCV2018|视觉目标跟踪之DaSiamRPN

ECCV2018|视觉目标跟踪之DaSiamRPN

极市平台

11+阅读 · 2018年8月22日

Speech2Action: Cross-modal Supervision for Action Recognition

Speech2Action: Cross-modal Supervision for Action Recognition

Arxiv

7+阅读 · 2020年3月30日

NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection

Arxiv

7+阅读 · 2019年4月16日

Progressive Sparse Local Attention for Video object detection

Arxiv

4+阅读 · 2019年3月21日

Panoptic Feature Pyramid Networks

Panoptic Feature Pyramid Networks

Arxiv

3+阅读 · 2019年1月8日

Softer-NMS: Rethinking Bounding Box Regression for Accurate Object Detection

Arxiv

4+阅读 · 2018年9月23日

Multi-task Learning of Pairwise Sequence Classification Tasks Over Disparate Label Spaces

Arxiv

3+阅读 · 2018年4月9日

Touch Your Heart: A Tone-aware Chatbot for Customer Care on Social Media

Arxiv

10+阅读 · 2018年3月8日

Arxiv

7+阅读 · 2018年1月24日

Spatial-Temporal Memory Networks for Video Object Detection

Arxiv

4+阅读 · 2017年12月18日

Appearance-and-Relation Networks for Video Classification

Arxiv

3+阅读 · 2017年11月24日

VIP会员

相关主题

多目标跟踪

相关VIP内容

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

专知会员服务

44+阅读 · 2020年6月30日

【CMU】基于图神经网络的联合检测与多目标跟踪

【CMU】基于图神经网络的联合检测与多目标跟踪

专知会员服务

59+阅读 · 2020年6月24日

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

专知会员服务

51+阅读 · 2020年5月28日

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

专知会员服务

33+阅读 · 2020年5月12日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【CVPR2020-谷歌】多目标(车辆)跟踪与检测框架 RetinaTrack

【CVPR2020-谷歌】多目标(车辆)跟踪与检测框架 RetinaTrack

专知会员服务

45+阅读 · 2020年4月10日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

FB大牛撰文推介，PySlowFast！Facebook开源视频理解前沿算法代码库，视频SOTA技术全在这了！

FB大牛撰文推介，PySlowFast！Facebook开源视频理解前沿算法代码库，视频SOTA技术全在这了！

专知会员服务

65+阅读 · 2020年1月6日

深度学习视频中多目标跟踪：论文综述

深度学习视频中多目标跟踪：论文综述

专知会员服务

94+阅读 · 2019年10月13日

【文献综述】视频多目标跟踪中的深度学习方法，38页pdf

【文献综述】视频多目标跟踪中的深度学习方法，38页pdf

专知会员服务

53+阅读 · 2019年8月1日

热门VIP内容

开通专知VIP会员享更多权益服务

《推进鲁棒自主系统定位：卷积神经网络标注优化技术》最新博士论文

《俄罗斯如何实施大规模作战行动》美陆军最新发布

关于美国防部最大武器项目的分析报告：F-35 Block 4升级延迟（附54页报告）

《迈向综合有益的军事机动能力建设路径》欧盟最新报告

相关资讯

CVPR2019通用目标检测

CVPR2019通用目标检测

极市平台

8+阅读 · 2019年8月6日

CenterNet：目标即点（代码已开源）

CenterNet：目标即点（代码已开源）

极市平台

25+阅读 · 2019年5月24日

从Densebox到Dubox：更快、性能更优、更易部署的anchor-free目标检测

从Densebox到Dubox：更快、性能更优、更易部署的anchor-free目标检测

极市平台

13+阅读 · 2019年5月14日

吊打YOLOv3！普林斯顿大学提出：CornerNet-Lite，基于关键点的实时且精度高的目标检测算法，已开源！

吊打YOLOv3！普林斯顿大学提出：CornerNet-Lite，基于关键点的实时且精度高的目标检测算法，已开源！

极市平台

30+阅读 · 2019年4月20日

多目标跟踪：SORT和Deep SORT

多目标跟踪：SORT和Deep SORT

极市平台

47+阅读 · 2019年3月18日

【学界】CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

【学界】CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

GAN生成式对抗网络

12+阅读 · 2019年3月5日

CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

极市平台

9+阅读 · 2019年3月5日

CVPR2019 | 全景分割：Attention-guided Unified Network

CVPR2019 | 全景分割：Attention-guided Unified Network

极市平台

9+阅读 · 2019年3月3日

ECCV 2018 | 行人检测全新视角：从人体中轴线标注出发

ECCV 2018 | 行人检测全新视角：从人体中轴线标注出发

极市平台

6+阅读 · 2018年9月7日

ECCV2018|视觉目标跟踪之DaSiamRPN

ECCV2018|视觉目标跟踪之DaSiamRPN

极市平台

11+阅读 · 2018年8月22日

相关论文

Speech2Action: Cross-modal Supervision for Action Recognition

Speech2Action: Cross-modal Supervision for Action Recognition

Arxiv

7+阅读 · 2020年3月30日

NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection

Arxiv

7+阅读 · 2019年4月16日

Progressive Sparse Local Attention for Video object detection

Arxiv

4+阅读 · 2019年3月21日

Panoptic Feature Pyramid Networks

Panoptic Feature Pyramid Networks

Arxiv

3+阅读 · 2019年1月8日

Softer-NMS: Rethinking Bounding Box Regression for Accurate Object Detection

Arxiv

4+阅读 · 2018年9月23日

Multi-task Learning of Pairwise Sequence Classification Tasks Over Disparate Label Spaces

Arxiv

3+阅读 · 2018年4月9日

Touch Your Heart: A Tone-aware Chatbot for Customer Care on Social Media

Arxiv

10+阅读 · 2018年3月8日

Arxiv

7+阅读 · 2018年1月24日

Spatial-Temporal Memory Networks for Video Object Detection

Arxiv

4+阅读 · 2017年12月18日

Appearance-and-Relation Networks for Video Classification

Arxiv

3+阅读 · 2017年11月24日

大家都在搜

软件无线电

大型语言模型

IJCAI2025教程

久别重逢话双塔

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员