MEMO，端到端的音频驱动的肖像动画，生成逼真的音频驱动的有声视频，实现无缝的音频-嘴唇同步

让我们看看演示视频吧！

MEMO，端到端的音频驱动的肖像动画，生成逼真的音频驱动的有声视频，实现无缝的音频-嘴唇同步。

MEMO可以生成带有肖像、雕塑、数字艺术和动画等图像的有声视频，可以生成具有语音、唱歌和说唱等音频类型的谈话视频，可以生成富有表现力的谈话视频或抵消视频中的情绪，可以生成具有各种头部姿势的谈话视频，可以生成持续时间长的有声视频，减少伪影和错误积累，支持多种语言，如英语、普通话、西班牙语、日语、韩语和粤语。

项目地址：https://memoavatar.github.io/

Github地址：https://github.com/memoavatar/memo

论文地址：https://arxiv.org/abs/2412.04448

微信扫描下方的二维码阅读本文

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

MEMO，端到端的音频驱动的肖像动画，生成逼真的音频驱动的有声视频，实现无缝的音频-嘴唇同步

评论(0)

提示：请文明发言取消回复

每日推文

MEMO，端到端的音频驱动的肖像动画，生成逼真的音频驱动的有声视频，实现无缝的音频-嘴唇同步

相关文章

Hallo2，百度开源的音频驱动生成说话视频，最长可生成1小时

screenshot-to-code，可以把屏幕截图转换为功能性代码

Enhance-A-Video，免训练提升视频质量，目前已支持混元和CogVideoX

ReCapture，谷歌推出的单个视频转换运镜的方法

评论(0)

提示：请文明发言 取消回复

标签云

每日推文

提示：请文明发言取消回复