3D human pose estimation from sketches has broad applications in computer animation and film production. Unlike traditional human pose estimation, this task presents unique challenges due to the abstract and disproportionate nature of sketches. Previous sketch-to-pose methods, constrained by the lack of large-scale sketch-3D pose annotations, primarily relied on optimization with heuristic rules-an approach that is both time-consuming and limited in generalizability. To address these challenges, we propose a novel approach leveraging a "learn from synthesis" strategy. First, a diffusion model is trained to synthesize sketch images from 2D poses projected from 3D human poses, mimicking disproportionate human structures in sketches. This process enables the creation of a synthetic dataset, SKEP-120K, consisting of 120k accurate sketch-3D pose annotation pairs across various sketch styles. Building on this synthetic dataset, we introduce an end-to-end data-driven framework for estimating human poses and shapes from diverse sketch styles. Our framework combines existing 2D pose detectors and generative diffusion priors for sketch feature extraction with a feed-forward neural network for efficient 2D pose estimation. Multiple heuristic loss functions are incorporated to guarantee geometric coherence between the derived 3D poses and the detected 2D poses while preserving accurate self-contacts. Qualitative, quantitative, and subjective evaluations collectively show that our model substantially surpasses previous ones in both estimation accuracy and speed for sketch-to-pose tasks.


翻译:从草图进行三维人体姿态估计在计算机动画和电影制作中具有广泛的应用。与传统的人体姿态估计不同,由于草图的抽象性和比例失调特性,该任务面临独特的挑战。以往的草图到姿态方法受限于缺乏大规模草图-三维姿态标注数据,主要依赖基于启发式规则的优化方法——这种方法既耗时又泛化能力有限。为应对这些挑战,我们提出了一种利用“从合成中学习”策略的新方法。首先,训练一个扩散模型,从三维人体姿态投影得到的二维姿态合成草图图像,以模拟草图中比例失调的人体结构。这一过程能够创建一个合成数据集SKEP-120K,其中包含12万个涵盖多种草图风格的精确草图-三维姿态标注对。基于此合成数据集,我们引入了一个端到端的数据驱动框架,用于从多样化的草图风格中估计人体姿态和形状。我们的框架结合了现有的二维姿态检测器和用于草图特征提取的生成扩散先验,以及一个用于高效二维姿态估计的前馈神经网络。我们引入了多种启发式损失函数,以确保推导出的三维姿态与检测到的二维姿态之间的几何一致性,同时保持精确的自接触关系。定性、定量和主观评估共同表明,在草图到姿态任务中,我们的模型在估计精度和速度上均显著超越了先前的方法。

0
下载
关闭预览

相关内容

Python图像处理,366页pdf,Image Operators Image Processing in Python
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员