让我们看看演示视频吧!

MEMO,端到端的音频驱动的肖像动画,生成逼真的音频驱动的有声视频,实现无缝的音频-嘴唇同步。

MEMO可以生成带有肖像、雕塑、数字艺术和动画等图像的有声视频,可以生成具有语音、唱歌和说唱等音频类型的谈话视频,可以生成富有表现力的谈话视频或抵消视频中的情绪,可以生成具有各种头部姿势的谈话视频,可以生成持续时间长的有声视频,减少伪影和错误积累,支持多种语言,如英语、普通话、西班牙语、日语、韩语和粤语。

项目地址:https://memoavatar.github.io/

Github地址:https://github.com/memoavatar/memo

论文地址:https://arxiv.org/abs/2412.04448



微信扫描下方的二维码阅读本文

MEMO,端到端的音频驱动的肖像动画,生成逼真的音频驱动的有声视频,实现无缝的音频-嘴唇同步插图

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。