In this report, we present some experienced improvements to YOLO series, forming a new high-performance detector -- YOLOX. We switch the YOLO detector to an anchor-free manner and conduct other advanced detection techniques, i.e., a decoupled head and the leading label assignment strategy SimOTA to achieve state-of-the-art results across a large scale range of models: For YOLO-Nano with only 0.91M parameters and 1.08G FLOPs, we get 25.3% AP on COCO, surpassing NanoDet by 1.8% AP; for YOLOv3, one of the most widely used detectors in industry, we boost it to 47.3% AP on COCO, outperforming the current best practice by 3.0% AP; for YOLOX-L with roughly the same amount of parameters as YOLOv4-CSP, YOLOv5-L, we achieve 50.0% AP on COCO at a speed of 68.9 FPS on Tesla V100, exceeding YOLOv5-L by 1.8% AP. Further, we won the 1st Place on Streaming Perception Challenge (Workshop on Autonomous Driving at CVPR 2021) using a single YOLOX-L model. We hope this report can provide useful experience for developers and researchers in practical scenes, and we also provide deploy versions with ONNX, TensorRT, NCNN, and Openvino supported. Source code is at https://github.com/Megvii-BaseDetection/YOLOX.


翻译:在本报告中,我们介绍了对YOLO系列的一些改进,形成了一个新的高性能探测器 -- -- YOLOX。我们将YOLO探测器转换为无锚制式,并开展了其他先进的探测技术,即分解头和领先标签分配战略SimOTA,以在大范围的模型中取得最先进的成果:对于YOLO-Nano,仅有0.91M参数和1.08G FLOPs,我们在COCO公司上获得了25.3%的AP,比NanoDet高出1.8%;对于YOLOV3,这是工业中最常用的探测器之一,我们将其提升到47.3%的AP,比目前的最佳做法高3.0% AP;对于YOLOX-L,其参数大致与YOLOv4-CSP、YOLOV5-L, 我们实现了50.OFPS, 以68.9的速度在Tesla V100的NEOLVVV-L,超过YOLOV-L, AP1.8%的部署速度超过YOL-APOVOL-DROVO, 我们还在AVOL AL VERVERO 上赢得了SOVOL-SO 20VOL-SOVERVOL 的S-SOVERVERVERVOR 20VOR 版本。

1
下载
关闭预览

相关内容

Yolo算法,其全称是You Only Look Once: Unified, Real-Time Object Detection,You Only Look Once说的是只需要一次CNN运算,Unified指的是这是一个统一的框架,提供end-to-end的预测,而Real-Time体现是Yolo算法速度快。
专知会员服务
20+阅读 · 2021年7月28日
《Golang修养之路》干货书
专知会员服务
33+阅读 · 2021年5月8日
专知会员服务
17+阅读 · 2021年4月24日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
144+阅读 · 2019年10月12日
开源书:PyTorch深度学习起步
专知会员服务
49+阅读 · 2019年10月11日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
一文读懂YOLO V5 与 YOLO V4
极市平台
17+阅读 · 2020年7月21日
YOLO简史
计算机视觉life
26+阅读 · 2019年3月7日
一文读懂目标检测:R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD
七月在线实验室
11+阅读 · 2018年7月18日
期待已久的—YOLO V3
计算机视觉战队
20+阅读 · 2018年4月13日
车辆目标检测
数据挖掘入门与实战
30+阅读 · 2018年3月30日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
【推荐】深度学习目标检测全面综述
机器学习研究会
21+阅读 · 2017年9月13日
Arxiv
8+阅读 · 2021年4月21日
Frustratingly Simple Few-Shot Object Detection
Arxiv
3+阅读 · 2020年3月16日
Arxiv
12+阅读 · 2019年4月9日
Arxiv
5+阅读 · 2018年10月4日
Arxiv
7+阅读 · 2018年1月24日
VIP会员
相关VIP内容
专知会员服务
20+阅读 · 2021年7月28日
《Golang修养之路》干货书
专知会员服务
33+阅读 · 2021年5月8日
专知会员服务
17+阅读 · 2021年4月24日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
144+阅读 · 2019年10月12日
开源书:PyTorch深度学习起步
专知会员服务
49+阅读 · 2019年10月11日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
相关资讯
一文读懂YOLO V5 与 YOLO V4
极市平台
17+阅读 · 2020年7月21日
YOLO简史
计算机视觉life
26+阅读 · 2019年3月7日
一文读懂目标检测:R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD
七月在线实验室
11+阅读 · 2018年7月18日
期待已久的—YOLO V3
计算机视觉战队
20+阅读 · 2018年4月13日
车辆目标检测
数据挖掘入门与实战
30+阅读 · 2018年3月30日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
【推荐】深度学习目标检测全面综述
机器学习研究会
21+阅读 · 2017年9月13日
Top
微信扫码咨询专知VIP会员