Qwen2.5-Omni,Qwen开源的端到端多模态大模型,无缝处理包括文本、图像、音频和视频在内的各种输入,同时支持流式的文本生成和自然语音合成输出。

Qwen2.5-Omni,Qwen开源的端到端多模态大模型,无缝处理包括文本、图像、音频和视频在内的各种输入,同时支持流式的文本生成和自然语音合成输出插图

项目地址:https://qwenlm.github.io/blog/qwen2.5-omni/

Github地址:https://github.com/QwenLM/Qwen2.5-Omni

模型下载地址:https://huggingface.co/Qwen/Qwen2.5-Omni-7B



微信扫描下方的二维码阅读本文

Qwen2.5-Omni,Qwen开源的端到端多模态大模型,无缝处理包括文本、图像、音频和视频在内的各种输入,同时支持流式的文本生成和自然语音合成输出插图1

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。