开源模型

Kimi-Audio,Kimi开源的音频基础模型,通用音频基础模型处理各种任务,如语音识别、音频理解、音频到文本聊天、语音到语音对话

2025.4.26 AI日报插图

开源项目

RealisDance-DiT,基于Wan2.1微调,对现有可控角色动画方法的姿态控制,实现了稳健生成、流畅动作和逼真的手部质量



微信扫描下方的二维码阅读本文

2025.4.26 AI日报插图1

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。