- 名称
- Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency
- 描述
随着基于扩散的视频生成技术的引入,音频调节的人类视频生成最近在运动的自然度和肖像细节的合成方面取得了重大突破。由于对驱动人体运动的音频信号的控制有限,现有方法经常添加辅助空间信号来稳定运动,这可能会损害运动的自然性和自由度。在本文中,我们提出了一种名为 Loopy 的端到端纯音频条件视频扩散模型 ...
随着基于扩散的视频生成技术的引入,音频调节的人类视频生成最近在运动的自然度和肖像细节的合成方面取得了重大突破。由于对驱动人体运动的音频信号的控制有限,现有方法经常添加辅助空间信号来稳定运动,这可能会损害运动的自然性和自由度。在本文中,我们提出了一种名为 Loopy 的端到端纯音频条件视频扩散模型 ...