视频目标识别资源集合

2019 年 6 月 15 日 专知

【导读】本文整理了视频目标识别的数据集、论文、代码等,并对它们的性能进行了比较。

数据集

ImageNet VID Chanllenge

网站:

  • http://image-net.org/challenges/LSVRC/2017/#vid

Kaggle:

  • https://www.kaggle.com/account/login?returnUrl=%2Fc%2Fimagenet-object-detection-from-video-challenge

VisDrone Challenge

网站:

  • http://aiskyeye.com/


论文集

2016

Seq-NMS for video object detection

  • https://arxiv.org/abs/1602.08465

  • 动机:在时间轴上,使预测的目标框更为光滑

  • 总结:根据不同相邻时刻的预测构建时序图,然后使用动态规划选择整体最好的序列。


T-CNN: Tubelets with Convolutional Neural Networks for Object Detection from Videos

  • https://arxiv.org/abs/1604.02532

  • https://github.com/myfavouritekk/T-CNN

  • 总结:使用跟踪算法,选择时序一致的高置信度的检测结果


Object Detection from Video Tubelets with Convolutional Neural Networks

  • https://arxiv.org/abs/1604.04053

  • https://github.com/myfavouritekk/vdetlib


Deep Feature Flow for Video Recognition

  • https://arxiv.org/abs/1611.07715

  • https://github.com/msracver/Deep-Feature-Flow


2017

Object Detection in Videos with Tubelet Proposal Networks

  • https://arxiv.org/abs/1702.06355


Flow-Guided Feature Aggregation for Video Object Detection

  • https://arxiv.org/abs/1703.10025

  • https://github.com/msracver/Flow-Guided-Feature-Aggregation


Detect to Track and Track to Detect

  • https://arxiv.org/abs/1710.03958

  • https://github.com/ZHANGHeng19931123/awesome-video-object-detection/blob/master/X.md

  • https://github.com/feichtenhofer/Detect-Track


Towards High Performance Video Object Detection

  • https://arxiv.org/abs/1711.11577


Video Object Detection with an Aligned Spatial-Temporal Memory

  • https://arxiv.org/abs/1712.06317

  • https://github.com/ZHANGHeng19931123/awesome-video-object-detection/blob/master/STMN.md

  • http://fanyix.cs.ucdavis.edu/project/stmn/project.html

  • https://www.youtube.com/watch?v=Vs3LqY1s9GY


2018

Object Detection in Videos by High Quality Object Linking

  • https://arxiv.org/abs/1801.09823


Towards High Performance Video Object Detection for Mobiles

  • https://arxiv.org/abs/1804.05830


Optimizing Video Object Detection via a Scale-Time Lattice

  • https://arxiv.org/abs/1804.05472、

  • https://github.com/ZHANGHeng19931123/awesome-video-object-detection/blob/master/X.md

  • https://github.com/hellock/scale-time-lattice


Object Detection in Video with Spatiotemporal Sampling Networks

  • https://arxiv.org/abs/1803.05549

  • https://github.com/ZHANGHeng19931123/awesome-video-object-detection/blob/master/STSN.md


Fully Motion-Aware Network for Video Object Detection

  • http://openaccess.thecvf.com/content_ECCV_2018/html/Shiyao_Wang_Fully_Motion-Aware_Network_ECCV_2018_paper.html

  • https://github.com/ZHANGHeng19931123/awesome-video-object-detection/blob/master/MANet.md


Integrated Object Detection and Tracking with Tracklet-Conditioned Detection

  • https://arxiv.org/abs/1811.11167

  • https://github.com/ZHANGHeng19931123/awesome-video-object-detection/blob/master/X.md


AdaScale: Towards Real-time Video Object Detection Using Adaptive Scaling

  • https://arxiv.org/pdf/1902.02910.pdf


Improving Video Object Detection by Seq-Bbox Matching

  • https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=2ahUKEwjWwNWa95_iAhUMyoUKHR-GAJwQFjABegQIBBAC&url=http%3A%2F%2Fwww.insticc.org%2FPrimoris%2FResources%2FPaperPdf.ashx%3FidPaper%3D72600&usg=AOvVaw1dTqzUoybpNRVkCdkA1xg0

  • https://github.com/ZHANGHeng19931123/seq_nms_yolo


性能比较:


Github链接:

https://github.com/ZHANGHeng19931123/awesome-video-object-detection

-END-

专 · 知

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎登录www.zhuanzhi.ai,注册登录专知,获取更多AI知识资料!

欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询

请加专知小助手微信(扫一扫如下二维码添加),加入专知人工智能主题群,咨询技术商务合作~

专知《深度学习:算法到实战》课程全部完成!550+位同学在学习,现在报名,限时优惠!网易云课堂人工智能畅销榜首位!

点击“阅读原文”,了解报名专知《深度学习:算法到实战》课程

登录查看更多
25

相关内容

目标识别是指一个特殊目标(或一种类型的目标)从其它目标(或其它类型的目标)中被区分出来的过程。它既包括两个非常相似目标的识别,也包括一种类型的目标同其他类型目标的识别。
专知会员服务
59+阅读 · 2020年3月19日
专知会员服务
109+阅读 · 2020年3月12日
八篇 ICCV 2019 【图神经网络(GNN)+CV】相关论文
专知会员服务
29+阅读 · 2020年1月10日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
93+阅读 · 2019年12月23日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
90+阅读 · 2019年10月16日
深度学习视频中多目标跟踪:论文综述
专知会员服务
90+阅读 · 2019年10月13日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
17+阅读 · 2019年10月9日
图像/视频去噪算法资源集锦
专知
17+阅读 · 2019年12月14日
【资源】2019年计算机视觉综述论文汇聚
专知
36+阅读 · 2019年11月26日
【资源】领域自适应相关论文、代码分享
专知
30+阅读 · 2019年10月12日
胶囊网络资源汇总
论智
7+阅读 · 2018年3月10日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
目标跟踪的一篇论文及代码视频
CreateAMind
8+阅读 · 2017年9月7日
Image Captioning: Transforming Objects into Words
Arxiv
7+阅读 · 2019年6月14日
Zero-Shot Object Detection
Arxiv
9+阅读 · 2018年7月27日
VIP会员
相关VIP内容
专知会员服务
59+阅读 · 2020年3月19日
专知会员服务
109+阅读 · 2020年3月12日
八篇 ICCV 2019 【图神经网络(GNN)+CV】相关论文
专知会员服务
29+阅读 · 2020年1月10日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
93+阅读 · 2019年12月23日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
90+阅读 · 2019年10月16日
深度学习视频中多目标跟踪:论文综述
专知会员服务
90+阅读 · 2019年10月13日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
17+阅读 · 2019年10月9日
相关资讯
图像/视频去噪算法资源集锦
专知
17+阅读 · 2019年12月14日
【资源】2019年计算机视觉综述论文汇聚
专知
36+阅读 · 2019年11月26日
【资源】领域自适应相关论文、代码分享
专知
30+阅读 · 2019年10月12日
胶囊网络资源汇总
论智
7+阅读 · 2018年3月10日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
目标跟踪的一篇论文及代码视频
CreateAMind
8+阅读 · 2017年9月7日
Top
微信扫码咨询专知VIP会员