mini-omni，开源的端到端实时语音模型，无需TTS模块，支持同时生成文本和语音

2024-09-04 开源模型

让我们看看官方演示视频吧！

mini-omni，开源的端到端实时语音模型，无需TTS模块，支持同时生成文本和语音。

Mini-Omni 是一种开源的多模型大型语言模型，可以边思考边听、边说。具有实时端到端语音输入和流式音频输出对话功能。

mini-omni，开源的端到端实时语音模型，无需TTS模块，支持同时生成文本和语音插图

Github地址：https://github.com/gpt-omni/mini-omni

模型下载地址：https://huggingface.co/gpt-omni/mini-omni

论文地址：https://arxiv.org/abs/2408.16725

微信扫描下方的二维码阅读本文

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

mini-omni 开源模型

评论(0)

提示：请文明发言取消回复