从1小时到3.5分钟，Meta新算法一部手机搞定3D人脸数据采集，可用于VR的那种

会员服务 ·

从1小时到3.5分钟，Meta新算法一部手机搞定3D人脸数据采集，可用于VR的那种

2022 年 7 月 7 日 极市平台

↑ 点击蓝字关注极市平台

来源丨量子位

编辑丨极市平台

极市导读

仅凭3.5分钟的数据，就足以生成高保真、可驱动的真实3D人脸头像？>>加入极市CV技术交流群，走在计算机视觉的最前沿

搞定这样的人脸3D建模需要几步？

在数据采集的阶段，答案是：一部手机 + 3.5分钟。

没错，仅凭这3.5分钟的数据，就足以生成高保真、可驱动的真实3D人脸头像。

这项研究来自Meta Reality Labs——就是扎克伯格元宇宙计划里的那个核心部门。论文已经被SIGGRAPH 2022接收。

作者提到，这一方法适用于VR应用。

也就是说，在VR的世界里，以后你可能就不必顶着一张卡通脸登场了。

而是可以方便地与胖友们“真身”相见。

方法原理

实现这一结果的方法框架如下图所示：

具体而言，分为三个部分。

首先，是要用大型多视角人脸数据集训练一个超网络，这个超网络可以通过神经网络解码器产生专属于个人的头像参数。

数据集中的人脸由多视角捕捉系统采集，包括255位不同年龄、性别和种族参与者的面部图像数据。

△左为图像捕获设备；右为采集到的人脸

这个捕获3D人脸的巨型装置是Meta在2019年研发的，其中配备171个高分辨率摄像头，每秒能记录180GB数据。采集时间在1个小时左右。

值得一提的是，在这个超网络中，解码器的基本组成模块是带有bias map的卷积上采样层。

这些bias map会被用来生成体积单元，进而通过射线追踪来渲染头像。

另外，该解码器结构能够将视线与其他面部活动区分开，这在VR应用中意味着能够更直接地利用眼动跟踪系统。

其次，是轻量级人脸表情捕捉。

在这项研究中，采集人脸只需要用到一部带有深度摄像头的智能手机。

实验中，研究人员采用的是iPhone 12。

采集过程就像这样：

采集到的数据要进行如下处理：

获取每一帧人脸图像中的几何形状和纹理；
对输入的RGB图像进行人脸标志检测和人像分割；
对模板网格进行拟合和变形，以匹配检测到的人脸标志物、分割轮廓和深度图；
对每一帧图像的纹理进行解包，而后汇总得到完整的人脸纹理。

在进一步完善模型的过程中，还需要采集65种特定的表情：

最后，该方法输出的3D人脸头像不仅能与用户外观高度匹配，通过全局表情空间，还能对其进行进一步的驱动、控制。

研究人员表示，整个采集过程大概要花费3.5分钟。

不过需要说明的是，建模的过程不是实时的，数据处理还要花费数小时的时间。

实验结果

说了这么多，效果如何，我们还是来看实验结果。

与Pinscreen提出的“一张照片构建3D数字化身”（CVPR 2021）的方法相比，该方法能生成更具真实感的人脸模型。

而与海德堡大学、慕尼黑工业大学、马普所等研究机构在Neural Head Avatars from Monocular RGB Videos一文中提出的方法相比，该方法能生成保真度更高的结果。

不过，作者也指出了该方法的局限性：hold不太住长发和眼镜，容易产生伪影。另外，该方法对于光照条件也有一定要求。

参考链接：
[1]论文：https://drive.google.com/file/d/1i4NJKAggS82wqMamCJ1OHRGgViuyoY6R/view
[2]Demo：https://www.youtube.com/watch?v=t7_TMD7v0Xs

公众号后台回复“项目实践”获取50+CV项目实践机会～

△点击卡片关注极市平台，获取最新CV干货

极市干货

最新数据集资源：医学图像开源数据集汇总

实操教程：Pytorch - 弹性训练原理分析｜《CUDA C 编程指南》导读

极视角动态：极视角作为重点项目入选「2022青岛十大资本青睐企业」榜单！｜极视角发布EQP激励计划，招募优质算法团队展开多维度生态合作！

“

点击阅读原文进入CV社区

收获更多技术干货

登录查看更多

相关内容

人脸

关注 0

54页PPT《元宇宙/VR/AR/合成媒体：塑造商业、工作、娱乐、游戏、广告、媒体、酒店、政府、卫生和其他部门未来的趋势》

专知会员服务

37+阅读 · 2022年7月1日

【AI+军事】附论文+PPT《使用机器学习技术来估计系统性能》，美国马里兰州阿伯丁试验场

专知会员服务

51+阅读 · 2022年4月10日

MGH:元数据引导的超图建模无监督人员再识别,MGH: Metadata Guided Hypergraph Modeling for Unsupervised Person Re-identification

专知会员服务

6+阅读 · 2022年3月22日

CVPR2022 | 多模态Transformer用于视频分割效果惊艳

专知会员服务

42+阅读 · 2022年3月12日

重邮高新波等最新《少样本目标检测算法》综述论文

专知会员服务

35+阅读 · 2021年11月2日

【ICCV 2021】HCFlow：使用一个统一的框架处理图像超分辨率和图像再缩放

专知会员服务

15+阅读 · 2021年10月4日

【CVPR2021】LiDAR R-CNN：一种快速、通用的二阶段3D检测器

专知会员服务

16+阅读 · 2021年4月3日

CVPR2021-单目实时全身捕捉的方法

专知会员服务

20+阅读 · 2021年3月18日

深度学习图像检索(CBIR): 十年之大综述

专知会员服务

47+阅读 · 2020年12月5日

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

专知会员服务

29+阅读 · 2020年4月5日

手机就能弄个3A级数字人！中国团队一套“乾坤大挪移”搞定

量子位

0+阅读 · 2022年6月2日

CVPR 2022 | 5秒手机猫片也能重建猫咪3D模型！Meta提出BANMo：为变形物体3D重建

CVer

1+阅读 · 2022年3月9日

5秒手机猫片也能重建猫咪3D模型，Meta提出新算法为变形物体建模 | CVPR 2022

量子位

1+阅读 · 2022年3月4日

一张照片就能生成3D模型，GAN和自动编码器碰撞出奇迹，苏黎世联邦理工学院出品

量子位

0+阅读 · 2022年3月2日

Meta开发新虚拟背景处理AI，让元宇宙中人像不再虚糊

新智元

0+阅读 · 2022年2月15日

Meta AI推出“杂食者”：一个模型搞定图像、视频和3D数据三大分类任务，性能还不输独立模型

量子位

0+阅读 · 2022年1月24日

这个AI能帮你快速搜监控：文字定位关键画面，24小时录像10分钟处理完

量子位

0+阅读 · 2022年1月23日

几分钟让小孩的人物涂鸦「动起来」，Meta AI创建了一个奇妙的火柴人世界

机器之心

0+阅读 · 2021年12月19日

小扎不要「脸」了？Facebook正式改名Meta！买它，满仓元宇宙

新智元

0+阅读 · 2021年10月29日

在元宇宙中绝对需要的双手！AI算法实现手指重建，倒酒沏茶不在话下，甚至可以摇花手！

THU数据派

0+阅读 · 2021年9月10日

GPU加速和风格感知的艺术图像和谐克隆

国家自然科学基金

4+阅读 · 2014年12月31日

气膜屏蔽微细电解加工方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于三维景物重构成技术的文物数字化与虚拟展示

国家自然科学基金

1+阅读 · 2014年12月31日

浅水中污染物模型的保正WENO格式及其快速算法

国家自然科学基金

0+阅读 · 2012年12月31日

基于成像畸变模型的鱼眼图像直接处理算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于上下文感知的部件组装三维建模

国家自然科学基金

0+阅读 · 2012年12月31日

基于面部肌肉运动模型的三维人脸表情识别研究

国家自然科学基金

0+阅读 · 2012年12月31日

移动机器人基于三维激光测距的室内场景认知与物体识别

国家自然科学基金

0+阅读 · 2012年12月31日

基于点云数据和运动捕捉数据的三维人体建模及动画仿真

国家自然科学基金

1+阅读 · 2012年12月31日

基于增强现实的精确截骨手术导航系统

国家自然科学基金

1+阅读 · 2012年12月31日

3DLG-Detector: 3D Object Detection via Simultaneous Local-Global Feature Learning

Arxiv

0+阅读 · 2022年8月31日

A Multi-Modality Ovarian Tumor Ultrasound Image Dataset for Unsupervised Cross-Domain Semantic Segmentation

Arxiv

0+阅读 · 2022年8月26日

Data-free Dense Depth Distillation

Arxiv

0+阅读 · 2022年8月26日

Yformer: U-Net Inspired Transformer Architecture for Far Horizon Time Series Forecasting

Arxiv

0+阅读 · 2022年8月25日

Image Manipulation Detection by Multi-View Multi-Scale Supervision

Arxiv

13+阅读 · 2021年7月25日

FocalMix: Semi-Supervised Learning for 3D Medical Image Detection

Arxiv

10+阅读 · 2020年3月20日

Meta-Transfer Learning for Zero-Shot Super-Resolution

Arxiv

43+阅读 · 2020年2月27日

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

CNN+CNN: Convolutional Decoders for Image Captioning

Arxiv

21+阅读 · 2018年5月23日

Image Captioning using Deep Neural Architectures

Arxiv

20+阅读 · 2018年1月17日

VIP会员