CyberHost 通过专门设计的 Codebook Attention 来强化对人脸和手部等关键区域的结构先验学习,在纯音频驱动下的手部生成质量甚至超越了许多基于视频驱动的方法。 视频链接:https://mp.weixin.qq.com/s/sf_fmjDUOaQXD7BbovaY5A 视频链接:https://mp.weixin.qq.com/s/sf_fmjDUO
特别是在纯音频驱动的场景下,由于缺乏骨架信息输入,保持手部动作的稳定性更具挑战。CyberHost 通过专门设计的 Codebook Attention 来强化对人脸和手部等关键区域的结构先验学习,在纯音频驱动下的手部生成质量甚至超越了许多基于视频驱动的方法。 打开网易新闻 查看精彩图片 打开网易新闻 查看精彩图片 视频链接:https://mp...