AI资讯
Ideogram推出Ideogram 3.0模型,令人惊叹的真实感、创意设计和一致的风格
OpenAI Agents SDK 也支持 MCP ,即将为 OpenAI API 和 ChatGPT 桌面应用程序提供 MCP 支持

开源模型
Qwen2.5-Omni,Qwen开源的端到端多模态大模型,无缝处理包括文本、图像、音频和视频在内的各种输入,同时支持流式的文本生成和自然语音合成输出

MoshiVis,基于Moshi开发的视觉语音模型,支持自然的对话风格和低延迟
开源项目
FirePlace,对 3D 对象放置常识推理,可根据语言指令为要插入 3D 场景的新 3D 对象生成对象位置
微信扫描下方的二维码阅读本文
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)