Real-time portrait animation is essential for interactive applications such as virtual assistants and live avatars, requiring high visual fidelity, temporal coherence, ultra-low latency, and responsive control from dynamic inputs like reference images and driving signals. While diffusion-based models achieve strong quality, their non-causal nature hinders streaming deployment. Causal autoregressive video generation approaches enable efficient frame-by-frame generation but suffer from error accumulation, motion discontinuities at chunk boundaries, and degraded long-term consistency. In this work, we present a novel streaming framework named Knot Forcing for real-time portrait animation that addresses these challenges through three key designs: (1) a chunk-wise generation strategy with global identity preservation via cached KV states of the reference image and local temporal modeling using sliding window attention; (2) a temporal knot module that overlaps adjacent chunks and propagates spatio-temporal cues via image-to-video conditioning to smooth inter-chunk motion transitions; and (3) A "running ahead" mechanism that dynamically updates the reference frame's temporal coordinate during inference, keeping its semantic context ahead of the current rollout frame to support long-term coherence. Knot Forcing enables high-fidelity, temporally consistent, and interactive portrait animation over infinite sequences, achieving real-time performance with strong visual stability on consumer-grade GPUs.


翻译:实时肖像动画对于虚拟助手和实时化身等交互式应用至关重要,需要高视觉保真度、时间连贯性、超低延迟以及对参考图像和驱动信号等动态输入的响应式控制。尽管基于扩散的模型实现了高质量生成,但其非因果特性阻碍了流式部署。因果自回归视频生成方法支持高效的逐帧生成,但存在误差累积、片段边界处的运动不连续性以及长期一致性退化等问题。本研究提出了一种名为“结力约束”的新型流式框架,用于实时肖像动画,通过三项关键设计应对上述挑战:(1)采用基于片段的生成策略,通过缓存参考图像的KV状态实现全局身份保持,并利用滑动窗口注意力进行局部时序建模;(2)引入时序结模块,通过图像到视频的条件传递使相邻片段重叠并传播时空线索,以平滑片段间的运动过渡;(3)设计“超前运行”机制,在推理过程中动态更新参考帧的时序坐标,使其语义上下文始终领先于当前生成帧,从而支持长期连贯性。结力约束能够在消费级GPU上实现高保真、时序一致且可交互的无限序列肖像动画,达到实时性能并具备强大的视觉稳定性。

0
下载
关闭预览

相关内容

Python图像处理,366页pdf,Image Operators Image Processing in Python
【ICML2020】持续终身学习的神经主题建模
专知会员服务
40+阅读 · 2020年6月22日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员