We present PercHead, a method for single-image 3D head reconstruction and semantic 3D editing - two tasks that are inherently challenging due to severe view occlusions, weak perceptual supervision, and the ambiguity of editing in 3D space. We develop a unified base model for reconstructing view-consistent 3D heads from a single input image. The model employs a dual-branch encoder followed by a ViT-based decoder that lifts 2D features into 3D space through iterative cross-attention. Rendering is performed using Gaussian Splatting. At the heart of our approach is a novel perceptual supervision strategy based on DINOv2 and SAM2.1, which provides rich, generalized signals for both geometric and appearance fidelity. Our model achieves state-of-the-art performance in novel-view synthesis and, furthermore, exhibits exceptional robustness to extreme viewing angles compared to established baselines. Furthermore, this base model can be seamlessly extended for semantic 3D editing by swapping the encoder and finetuning the network. In this variant, we disentangle geometry and style through two distinct input modalities: a segmentation map to control geometry and either a text prompt or a reference image to specify appearance. We highlight the intuitive and powerful 3D editing capabilities of our model through a lightweight, interactive GUI, where users can effortlessly sculpt geometry by drawing segmentation maps and stylize appearance via natural language or image prompts. Project Page: https://antoniooroz.github.io/PercHead Video: https://www.youtube.com/watch?v=4hFybgTk4kE


翻译:我们提出了PercHead,一种用于单图像三维头部重建与语义三维编辑的方法——这两个任务由于严重的视角遮挡、微弱的感知监督以及三维空间中编辑的模糊性而具有内在挑战性。我们开发了一个统一的基模型,用于从单张输入图像重建视角一致的三维头部。该模型采用双分支编码器,后接一个基于ViT的解码器,通过迭代交叉注意力将二维特征提升至三维空间。渲染使用高斯泼溅技术实现。我们方法的核心是一种基于DINOv2和SAM2.1的新型感知监督策略,它为几何和外观保真度提供了丰富且泛化的信号。我们的模型在新视角合成方面实现了最先进的性能,并且与现有基线相比,对极端视角表现出卓越的鲁棒性。此外,该基模型可通过交换编码器并微调网络,无缝扩展用于语义三维编辑。在此变体中,我们通过两种不同的输入模态解耦几何与风格:一个用于控制几何的分割图,以及一个用于指定外观的文本提示或参考图像。我们通过一个轻量级交互式GUI展示了我们模型直观且强大的三维编辑能力,用户可以通过绘制分割图轻松塑造几何形状,并通过自然语言或图像提示来风格化外观。项目页面:https://antoniooroz.github.io/PercHead 视频:https://www.youtube.com/watch?v=4hFybgTk4kE

0
下载
关闭预览

相关内容

【CVPR2024】ViewDiff: 3D一致的图像生成与文本到图像模型
专知会员服务
30+阅读 · 2024年3月10日
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员