VideoChat，实时语音交互数字人，支持端到端语音方案，可自定义数字人形象与音色，支持音色克隆

2024-11-12 开源项目

VideoChat，实时语音交互数字人，支持端到端语音方案，可自定义数字人形象与音色，支持音色克隆。

支持TTS模块添加音色克隆功能，LLM模块添加qwen本地推理，支持GLM-4-Voice，提供ASR-LLM-TTS-THG和MLLM-THG两种生成方式，GLM-4-Voice集成vllm推理加速等。

VideoChat，实时语音交互数字人，支持端到端语音方案，可自定义数字人形象与音色，支持音色克隆插图

Github地址：https://github.com/Henry-23/VideoChat

在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

微信扫描下方的二维码阅读本文

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

VideoChat 开源项目

评论(0)

提示：请文明发言取消回复