ICCV2021 RealVSR: 业界首个移动端真实场景视频超分数据集 - 专知VIP

会员服务 ·

2

ICCV 2021 · 视频超分 ·

2021 年 9 月 28 日

ICCV2021 RealVSR: 业界首个移动端真实场景视频超分数据集

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

视频超分旨在对低分辨率视频提升分辨率的同时对细节进行增强(可能还会附带噪声抑制、压缩伪影移除亦或取出运动模糊)。现有的视频超分方案大多在合成数据上进行训练，这种简单的退化机制在面对真实场景的复杂退化时就会出现严重的性能下降。因此，如何将学术界的视频超分方案应用到真实场景，或者缩小两者之间的性能差异就更为值得进行探索与研究。

为缓解上述问题，本文采用多个相机(iPhone 11 Pro Max)采用成对LR-HR视频序列构建了一个Real-world Video Super-Resolution(RealVSR) 。由于LR-HR视频对是通过两个相机采集得到，两者之间不可避免会存在某种程度的不对齐、亮度/色彩差异。为更鲁棒的进行VSR模型训练、重建更多细节，我们将LR-HR视频转换为YCbCr颜色空间，将亮度通道分解为拉普拉斯金字塔，针对不同的成分实施不同的损失函数。

实验结果表明：相比合成数据训练的模型，在RealVSR数据集上训练的VSR模型在真实场景数据具有更好的视觉质量，边缘更锐利。此外，这些模型表现出了非常好了跨相机泛化性能。下图给出了合成数据训练模型与RealVSR训练模型的效果对比，很明显：在RealVSR上训练的视频超分模型在真实数据上重建细节更为清晰。

成为VIP会员查看完整内容

23

相关内容

ICCV 2021

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知会员服务

14+阅读 · 2021年11月14日

【ICCV2021】域分离的全时段自监督单目深度估计

专知会员服务

6+阅读 · 2021年9月22日

【ICCV2021】用于图像复原的动态注意力图学习

专知会员服务

13+阅读 · 2021年9月17日

【ICCV2021】自监督蒸馏的长尾视觉识别

专知会员服务

23+阅读 · 2021年9月16日

【ICCV2021】内容感知特征调制的压缩视频传输

专知会员服务

12+阅读 · 2021年9月13日

CVPR 2021 Oral | 室内动态场景中的相机重定位

CVPR 2021 Oral | 室内动态场景中的相机重定位

专知会员服务

15+阅读 · 2021年4月12日

【CVPR2021】基于跨任务场景结构知识迁移的单张深度图像超分辨率方法

专知会员服务

17+阅读 · 2021年3月23日

【ACM MM2020】对偶注意力GAN语义图像合成

【ACM MM2020】对偶注意力GAN语义图像合成

专知会员服务

34+阅读 · 2020年9月2日

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

专知会员服务

28+阅读 · 2020年3月26日

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

专知会员服务

24+阅读 · 2020年3月15日

放大的艺术 | 基于深度学习的单图超分辨

放大的艺术 | 基于深度学习的单图超分辨

AI科技评论

7+阅读 · 2019年8月21日

动态 | 快手 ICIP 2019 移动视频修复大赛开启报名啦！

动态 | 快手 ICIP 2019 移动视频修复大赛开启报名啦！

AI科技评论

5+阅读 · 2019年3月30日

AI新领地—打通图像增强和视觉识别的“任督二脉”

AI新领地—打通图像增强和视觉识别的“任督二脉”

人工智能前沿讲习班

5+阅读 · 2019年3月14日

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

PaperWeekly

18+阅读 · 2019年1月18日

【泡泡图灵智库】DynaSLAM：动态场景中的追踪、建图和修复（arXiv）

【泡泡图灵智库】DynaSLAM：动态场景中的追踪、建图和修复（arXiv）

泡泡机器人SLAM

13+阅读 · 2019年1月9日

ECCV 2018 | 腾讯优图提出几何对抗损失函数在单视图3D物体重建中的应用

ECCV 2018 | 腾讯优图提出几何对抗损失函数在单视图3D物体重建中的应用

机器之心

4+阅读 · 2018年8月17日

CVPR 2018 | 腾讯优图提出SRN-DeblurNet：高效高质量去除复杂图像模糊

CVPR 2018 | 腾讯优图提出SRN-DeblurNet：高效高质量去除复杂图像模糊

机器之心

10+阅读 · 2018年5月30日

ETH Zurich提出新型网络「ROAD-Net」，解决语义分割域适配问题

ETH Zurich提出新型网络「ROAD-Net」，解决语义分割域适配问题

PaperWeekly

4+阅读 · 2018年5月3日

基于GAN的极限图像压缩框架

基于GAN的极限图像压缩框架

论智

11+阅读 · 2018年4月15日

【泡泡一分钟】基于深度增强学习的目标驱动式室内场景视觉导航（ICRA-21）

【泡泡一分钟】基于深度增强学习的目标驱动式室内场景视觉导航（ICRA-21）

泡泡机器人SLAM

6+阅读 · 2018年1月11日

KD3A: Unsupervised Multi-Source Decentralized Domain Adaptation via Knowledge Distillation

Arxiv

10+阅读 · 2020年12月8日

In-Domain GAN Inversion for Real Image Editing

Arxiv

3+阅读 · 2020年7月16日

Fine-tune BERT for Extractive Summarization

Arxiv

3+阅读 · 2019年9月5日

SiamVGG: Visual Tracking using Deeper Siamese Networks

SiamVGG: Visual Tracking using Deeper Siamese Networks

Arxiv

5+阅读 · 2019年3月3日

Object-driven Text-to-Image Synthesis via Adversarial Training

Object-driven Text-to-Image Synthesis via Adversarial Training

Arxiv

6+阅读 · 2019年2月27日

Recurrent Fusion Network for Image Captioning

Recurrent Fusion Network for Image Captioning

Arxiv

3+阅读 · 2018年7月31日

DSGAN: Generative Adversarial Training for Distant Supervision Relation Extraction

Arxiv

15+阅读 · 2018年5月24日

Mask-aware Photorealistic Face Attribute Manipulation

Arxiv

5+阅读 · 2018年4月24日

Saliency-Enhanced Robust Visual Tracking

Arxiv

6+阅读 · 2018年2月8日

Semi-supervised FusedGAN for Conditional Image Generation

Arxiv

8+阅读 · 2018年1月17日

VIP会员

相关主题

相关VIP内容

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知会员服务

14+阅读 · 2021年11月14日

【ICCV2021】域分离的全时段自监督单目深度估计

专知会员服务

6+阅读 · 2021年9月22日

【ICCV2021】用于图像复原的动态注意力图学习

专知会员服务

13+阅读 · 2021年9月17日

【ICCV2021】自监督蒸馏的长尾视觉识别

专知会员服务

23+阅读 · 2021年9月16日

【ICCV2021】内容感知特征调制的压缩视频传输

专知会员服务

12+阅读 · 2021年9月13日

CVPR 2021 Oral | 室内动态场景中的相机重定位

CVPR 2021 Oral | 室内动态场景中的相机重定位

专知会员服务

15+阅读 · 2021年4月12日

【CVPR2021】基于跨任务场景结构知识迁移的单张深度图像超分辨率方法

专知会员服务

17+阅读 · 2021年3月23日

【ACM MM2020】对偶注意力GAN语义图像合成

【ACM MM2020】对偶注意力GAN语义图像合成

专知会员服务

34+阅读 · 2020年9月2日

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

专知会员服务

28+阅读 · 2020年3月26日

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

专知会员服务

24+阅读 · 2020年3月15日

热门VIP内容

相关资讯

放大的艺术 | 基于深度学习的单图超分辨

放大的艺术 | 基于深度学习的单图超分辨

AI科技评论

7+阅读 · 2019年8月21日

动态 | 快手 ICIP 2019 移动视频修复大赛开启报名啦！

动态 | 快手 ICIP 2019 移动视频修复大赛开启报名啦！

AI科技评论

5+阅读 · 2019年3月30日

AI新领地—打通图像增强和视觉识别的“任督二脉”

AI新领地—打通图像增强和视觉识别的“任督二脉”

人工智能前沿讲习班

5+阅读 · 2019年3月14日

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

PaperWeekly

18+阅读 · 2019年1月18日

【泡泡图灵智库】DynaSLAM：动态场景中的追踪、建图和修复（arXiv）

【泡泡图灵智库】DynaSLAM：动态场景中的追踪、建图和修复（arXiv）

泡泡机器人SLAM

13+阅读 · 2019年1月9日

ECCV 2018 | 腾讯优图提出几何对抗损失函数在单视图3D物体重建中的应用

ECCV 2018 | 腾讯优图提出几何对抗损失函数在单视图3D物体重建中的应用

机器之心

4+阅读 · 2018年8月17日

CVPR 2018 | 腾讯优图提出SRN-DeblurNet：高效高质量去除复杂图像模糊

CVPR 2018 | 腾讯优图提出SRN-DeblurNet：高效高质量去除复杂图像模糊

机器之心

10+阅读 · 2018年5月30日

ETH Zurich提出新型网络「ROAD-Net」，解决语义分割域适配问题

ETH Zurich提出新型网络「ROAD-Net」，解决语义分割域适配问题

PaperWeekly

4+阅读 · 2018年5月3日

基于GAN的极限图像压缩框架

基于GAN的极限图像压缩框架

论智

11+阅读 · 2018年4月15日

【泡泡一分钟】基于深度增强学习的目标驱动式室内场景视觉导航（ICRA-21）

【泡泡一分钟】基于深度增强学习的目标驱动式室内场景视觉导航（ICRA-21）

泡泡机器人SLAM

6+阅读 · 2018年1月11日

相关论文

KD3A: Unsupervised Multi-Source Decentralized Domain Adaptation via Knowledge Distillation

Arxiv

10+阅读 · 2020年12月8日

In-Domain GAN Inversion for Real Image Editing

Arxiv

3+阅读 · 2020年7月16日

Fine-tune BERT for Extractive Summarization

Arxiv

3+阅读 · 2019年9月5日

SiamVGG: Visual Tracking using Deeper Siamese Networks

SiamVGG: Visual Tracking using Deeper Siamese Networks

Arxiv

5+阅读 · 2019年3月3日

Object-driven Text-to-Image Synthesis via Adversarial Training

Object-driven Text-to-Image Synthesis via Adversarial Training

Arxiv

6+阅读 · 2019年2月27日

Recurrent Fusion Network for Image Captioning

Recurrent Fusion Network for Image Captioning

Arxiv

3+阅读 · 2018年7月31日

DSGAN: Generative Adversarial Training for Distant Supervision Relation Extraction

Arxiv

15+阅读 · 2018年5月24日

Mask-aware Photorealistic Face Attribute Manipulation

Arxiv

5+阅读 · 2018年4月24日

Saliency-Enhanced Robust Visual Tracking

Arxiv

6+阅读 · 2018年2月8日

Semi-supervised FusedGAN for Conditional Image Generation

Arxiv

8+阅读 · 2018年1月17日

微信扫码咨询专知VIP会员