VideoChat,实时语音交互数字人,支持端到端语音方案,可自定义数字人形象与音色,支持音色克隆。

支持TTS模块添加音色克隆功能,LLM模块添加qwen本地推理,支持GLM-4-Voice,提供ASR-LLM-TTS-THG和MLLM-THG两种生成方式,GLM-4-Voice集成vllm推理加速等。

VideoChat,实时语音交互数字人,支持端到端语音方案,可自定义数字人形象与音色,支持音色克隆插图

Github地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat



微信扫描下方的二维码阅读本文

VideoChat,实时语音交互数字人,支持端到端语音方案,可自定义数字人形象与音色,支持音色克隆插图1

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。