商汤发布了日日新SenseNova 5.5,对比日日新 5.0,性能提升30%,交互效果及多项核心指标实现对标GPT-4o

日日新 5.5具备流式原生多模态交互能力,能更自然和直观地处理文本、图像、声音和视频等多种信息类型。

同时推出了【日日新 5o】,一个“所见即所得”模型,以及【Vimi】,一个可控人物视频生成模型。

日日新 5o通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,使得与其交互就像与人类自己交流一样直接,它可以见你所见,理解你所需。

Vimi能够精确控制人物面部表情,在半身像范围内调节人物的自然姿态,自动生成与人物相匹配的头发、服装以及背景的变化。

商汤发布了日日新SenseNova 5.5,交互效果及多项核心指标实现对标GPT-4o插图


微信扫描下方的二维码阅读本文

商汤发布了日日新SenseNova 5.5,交互效果及多项核心指标实现对标GPT-4o插图1

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。