Sonic,腾讯开源的音频驱动肖像动画项目,适合长视频生成,在口型同步、表情和头部运动方面效果不错。

Github地址:https://github.com/jixiaozhong/Sonic

详细与演示:https://www.52wts.cn/5848.html

AniPortrait,开源的AI数字人工具,能够根据用户上传的照片和相应的音频文件,生成具有动画风格的动态视频。

Github地址:https://github.com/Zejun-Yang/AniPortrait

详细与演示:https://www.52wts.cn/2000.html

JoyHallo,京东开源的普通话数字人项目,从效果看唇形表达流畅自然。

Github地址:https://github.com/jdh-algo/JoyHallo

详细与演示:https://www.52wts.cn/3593.html

TANGO,开源的口型同步模型,专门用来解决人物对话和手势的同步。

Github地址:https://github.com/CyberAgentAILab/TANGO

详细与演示:https://www.52wts.cn/3861.html

EchoMimicV2,支付宝开源的生成数字人视频,与V1版本相比可以生成半身体的人体动画。

Github地址:https://github.com/antgroup/echomimic_v2

详细与演示:https://www.52wts.cn/4691.html

Loopy,字节发布的通过音频控制人物头像的表情和动作,不过没有开源。

详细与演示:https://www.52wts.cn/3135.html

OmniHuman-1,字节跳动推出的端到端多模态条件人体视频生成框架,可以根据单个人体图像和运动信号生成人体视频,不过没有开源。

详细与演示:https://www.52wts.cn/5748.html

PersonaTalk,字节跳动发布的音频驱动的视觉配音框架,可以创建唇形同步视频的配音,同时保留个人的谈话风格和面部细节,不过没有开源。

详细与演示:https://www.52wts.cn/4137.html

JoyVASA,京东健康和浙大开源的音频生成肖像和动物图像动画。

Github地址:https://github.com/jdh-algo/JoyVASA

详细与演示:https://www.52wts.cn/4656.html

FLOAT,音频驱动的谈话肖像视频生成,可以增强语音驱动的情感运动,目前并未开源。

详细与演示:https://www.52wts.cn/4867.html

INFP,字节跳动推出音频驱动的交互式头部生成,可以实现两个数字人实时语音交流,不过没有开源。

详细与演示:https://www.52wts.cn/5205.html

Hallo3,百度开源的Hallo的第三个版本,输入音频和角色图片,可以生成该角色讲对应语音的视频,嘴型与语音匹配,有表情,有头部动作。

Github地址:https://github.com/fudan-generative-vision/hallo3

详细与演示:https://www.52wts.cn/5447.html



微信扫描下方的二维码阅读本文

开源数字人系列,开源嘴型同步系列,音频+图片生成逼真的动态视频插图

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。