一举打败16个同类模型，视频超分比赛冠军算法入选CVPR 2022，来自商汤&南洋理工大学

会员服务 ·

一举打败16个同类模型，视频超分比赛冠军算法入选CVPR 2022，来自商汤&南洋理工大学

2022 年 3 月 6 日 量子位

丰色发自凹非寺
量子位 | 公众号 QbitAI

如何让模糊的老片变高清？

AI的答案是超分辨率算法：

现在，在视频超分领域，有一个强大的算法拿下了超分比赛NTIRE 2021三冠一亚的优异成绩，登上了CVPR 2022。

它的名字叫做BasicVSR++，是对视频超分SOTA模型BasicVSR的进一步改进。

BasicVSR也曾拿下NTIRE冠军，入选CVPR 2021。

现在，这个BasicVSR+++在基本相同的参数量下，不仅性能大幅超过前辈，PSNR（峰值信噪比，图像质量评估指标）提高了0.82dB，还能应用到更多的视频复原任务中（例如压缩视频增强）。

加强版BasicVSR

BasicVSR采用双向传播(propagation)+特征对齐方式，能够提取整个输入视频中的有效信息进行超分。

但是，它这一基本设计也限制了信息聚合的功效，比如难以恢复精细的细节，尤其是在处理复杂的遮挡区域时。

因此，加强版的BasicVSR++在传播和对齐方面进行了重新改造，采用了二阶网格传播(second-order grid propagation) 和光流引导可变形对齐 (flow-guided deformable alignment)的设计来改善网络中的信息聚合能力，提升遮挡区域的鲁棒性和有效性。

其中，二阶网格可以让信息从不同的时空位置进行前向后后向传播，让特征的传播更有效。

光流引导可变形对齐则可以让帧进行更具鲁棒性的特征对齐。

采用这一对齐方式主要是单纯的形变对齐训练效果不稳定，尽管可变形卷积 (DCN) 网络中具备多样性的偏移量（offset）使形变对齐的性能优于光流对齐。

BasicVSR+++具体架构如下：

给定输入视频，首先采用残差模块对每一帧提取特征；然后这些特征在二阶网络传播中进行信息传播，其中对齐部分采用光流引导形变对齐；完成信息传播后，汇聚特征生成输出图像。

在16个同类算法中性能全部最佳

作者对比了16种不同视频超分算法的性能、参数量以及耗时，结果是BasicVSR++在所有数据集下的两种退化方式中均取得最佳性能（红色代表最佳分数，蓝色代表次佳分数）。

特别地，相比大容量滑动窗口算法EDSR，BasicVSR++获得了1.3dB的性能提升，同时参数量少65%；

相比之前的最新技术IconVSR，BasicVSR++在参数量更少的同时也带来了1dB的性能提升。

更轻量版的BasicVSR++ (S)，相比前辈BasicVSR，也有0.82dB的提升，收益显著。

而在具体效果中，不管是在REDS4、Vimeo-90K-T还是Vid4数据集上，BasicVSR++都能对极细节的图像进行复原，且效果最好。

目前，BasicVSR++的代码已经开源，感兴趣的同学可以去试试。

作者介绍

一作陈焯杰 (Kelvin C.K. Chan) 来自南洋理工大学计算机科学与工程学院，博士三年级在读，本硕毕业于香港中文大学。

目前的研究方向为图像/视频恢复，一共发表过5篇顶会论文。

通讯作者为他的导师吕健勤（Chen Change Loy），南洋理工大学计算机学院副教授，商汤-南洋理工大学联合实验室S-Lab副主任。

他俩也是BasicVSR的原班作者。

BasicVSR++的剩余两位作者分别为：该校二年级博士生周尚辰和该校研究员Xu Xiangyu。

论文地址：
https://arxiv.org/abs/2104.13371

代码：

https://github.com/ckkelvinchan/RealBasicVSR

— 完 —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容，未经账号授权，禁止随意转载。

直播报名 | AI+边缘计算赋能传统企业

在信息化浪潮下，传统企业如何综合利用人工智能、边缘计算等技术勇立潮头，智慧发展？

3月8日19:30，「量子位·视点」CEO/CTO系列分享活动邀请了江行智能CTO樊小毅博士，将围绕AI+边缘计算如何助力碳中和目标、典型应用和未来展望等内容，直播分享个人见解。扫码可报名：

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」「点赞」和「在看」

科技前沿进展日日相见 ~

登录查看更多

相关内容

超分

关注 0

【CVPR2022】 Dropout在图像超分任务中的重煥新生

专知会员服务

19+阅读 · 2022年3月5日

何恺明的ResNet论文，被引量刚突破10万+

专知会员服务

27+阅读 · 2021年12月19日

ICCV2021 RealVSR: 业界首个移动端真实场景视频超分数据集

专知会员服务

24+阅读 · 2021年9月28日

【ICCV2021】内容感知特征调制的压缩视频传输

专知会员服务

13+阅读 · 2021年9月13日

【CVPR 2021】半监督视频目标分割新算法，实现SOTA性能

专知会员服务

13+阅读 · 2021年4月26日

近期必读的五篇AAAI 2021【视频理解】相关论文和代码

专知会员服务

51+阅读 · 2021年1月19日

【AAAI2021】利用先验知识对场景图进行分类

专知会员服务

61+阅读 · 2020年12月3日

【CVPR2020】时序分组注意力视频超分

专知会员服务

31+阅读 · 2020年7月1日

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

专知会员服务

26+阅读 · 2020年5月7日

【Nature论文】深度网络中的梯度下降复杂度控制

专知会员服务

41+阅读 · 2020年3月9日

CVPR 2022 | 商汤&南洋理工开源PTTR：基于Transformer的3D点云目标跟踪网络

CVer

3+阅读 · 2022年3月31日

一文解读CVPR等9个顶会挑战赛冠军团队方案，助你参悟AI算法设计之道

机器之心

5+阅读 · 2022年3月19日

CVPR 2022 | Restormer: 刷新多个low-level任务指标

极市平台

0+阅读 · 2022年3月13日

CVPR 2022 | 一举打败16个同类模型！视频超分辨率冠军算法开源了！

CVer

0+阅读 · 2022年3月7日

【CVPR2022】Dropout在图像超分任务中的重煥新生

专知

0+阅读 · 2022年3月5日

ICCV2021 | 参数量仅为原来1%，北邮等利用超分算法提出高性能视频传输方法

机器之心

1+阅读 · 2021年9月3日

Interspeech 2021 | 腾讯AI Lab解读9篇入选论文

腾讯AI实验室

0+阅读 · 2021年8月31日

重磅！商汤开源目标跟踪最强算法SiamRPN系列

AI前线

13+阅读 · 2019年5月24日

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

AI100

14+阅读 · 2019年3月9日

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

机器之心

16+阅读 · 2018年3月12日

深度低秩的结构-纹理图像分割模型和算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向3D-TOF相机的高质量深度图像重建方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于压缩感知的图像盲恢复模型和算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于稀疏表示的湍流介质中光学成像的图像盲复原问题研究

国家自然科学基金

0+阅读 · 2013年12月31日

空变运动模糊图像的盲复原变分模型及其快速算法

国家自然科学基金

0+阅读 · 2013年12月31日

基于弱监督学习和深度信息的目标跟踪算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

多能见度下多视角动态图像传感网融合算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

变分正则化图像复原模型与算法的研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于非局部平均方法的图像复原研究

国家自然科学基金

0+阅读 · 2011年12月31日

劣化虹膜图像复原与识别技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

A Generalisable Data Fusion Framework to Infer Mode of Transport Using Mobile Phone Data

Arxiv

0+阅读 · 2022年4月20日

Multi-Camera Multiple 3D Object Tracking on the Move for Autonomous Vehicles

Arxiv

2+阅读 · 2022年4月19日

Semi-Supervised Super-Resolution

Arxiv

1+阅读 · 2022年4月19日

A qualitative investigation of optical flow algorithms for video denoising

Arxiv

0+阅读 · 2022年4月19日

BSRT: Improving Burst Super-Resolution with Swin Transformer and Flow-Guided Deformable Alignment

Arxiv

0+阅读 · 2022年4月18日

VDTR: Video Deblurring with Transformer

Arxiv

0+阅读 · 2022年4月17日

VoiceFixer: A Unified Framework for High-Fidelity Speech Restoration

Arxiv

0+阅读 · 2022年4月17日

Single-shot Embedding Dimension Search in Recommender System

Arxiv

0+阅读 · 2022年4月15日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Multimodal Sentiment Analysis using Hierarchical Fusion with Context Modeling

Arxiv

11+阅读 · 2018年6月16日

VIP会员