Diffusion models (DMs) have recently achieved impressive photorealism in image and video generation. However, their application to image animation remains limited, even when trained on large-scale datasets. Two primary challenges contribute to this: the high dimensionality of video signals leads to a scarcity of training data, causing DMs to favor memorization over prompt compliance when generating motion; moreover, DMs struggle to generalize to novel motion patterns not present in the training set, and fine-tuning them to learn such patterns, especially using limited training data, is still under-explored. To address these limitations, we propose Modular Image-to-Video Adapter (MIVA), a lightweight sub-network attachable to a pre-trained DM, each designed to capture a single motion pattern and scalable via parallelization. MIVAs can be efficiently trained on approximately ten samples using a single consumer-grade GPU. At inference time, users can specify motion by selecting one or multiple MIVAs, eliminating the need for prompt engineering. Extensive experiments demonstrate that MIVA enables more precise motion control while maintaining, or even surpassing, the generation quality of models trained on significantly larger datasets.


翻译:扩散模型(DMs)最近在图像和视频生成方面取得了令人印象深刻的逼真效果。然而,即使在大规模数据集上训练,它们在图像动画方面的应用仍然有限。两个主要挑战导致了这一现状:视频信号的高维度性导致训练数据稀缺,使得DMs在生成运动时倾向于记忆而非遵循提示;此外,DMs难以泛化到训练集中未出现过的新运动模式,而利用有限训练数据对其进行微调以学习此类模式的研究仍处于探索不足的阶段。为了解决这些局限性,我们提出了模块化图像到视频适配器(MIVA),这是一种可附加到预训练DM上的轻量子网络,每个模块旨在捕获单一运动模式,并可通过并行化实现扩展。MIVA可以在单个消费级GPU上使用大约十个样本进行高效训练。在推理时,用户可以通过选择一个或多个MIVA来指定运动,从而无需进行提示工程。大量实验表明,MIVA能够在保持甚至超越基于更大规模数据集训练模型生成质量的同时,实现更精确的运动控制。

0
下载
关闭预览

相关内容

【CVPR2024】掩码自解码器是有效的多任务视觉通用模型
专知会员服务
20+阅读 · 2024年3月16日
【CVPR2024】ViewDiff: 3D一致的图像生成与文本到图像模型
专知会员服务
30+阅读 · 2024年3月10日
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员