EchoMimic 不仅能够通过音频和面部特征点单独生成人像视频,还可以通过音频和选定的面部特征点的组合生成人像视频。

EchoMimic 支持不同语言的音频输入,并能够根据不同语言的特点生成相应的肖像动画。

此外,它还可以处理不同风格的音频,如普通话、英语和歌唱等。

面部标志点(Facial Landmarks)是指在面部图像上标注的一组特定点,用于表示面部的关键特征和结构。它们通常位于面部的轮廓、眼睛、鼻子、嘴巴等位置。

这些点可以帮助计算机视觉算法更好地理解和分析面部表情、动作和姿态。面部标志点通常用于人脸识别、表情识别、面部动画等领域。

让我们看看官方演示视频吧!

开源项目地址:https://github.com/BadToBest/EchoMimic



微信扫描下方的二维码阅读本文

EchoMimic,支付宝开源的通过音频和面部标志生成逼真的音画同步肖像视频插图

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。