AI资讯

Gemini 2.0 Flash Experimental,谷歌推出的AI版PS,完全的对话式修图,一致性做的非常棒

2025.3.14 AI日报插图

开源模型

CSM,Sesame开源的语音生成模型,可根据文本和音频输入生成 RVQ 音频代码

2025.3.14 AI日报插图1

开源项目

IMM,Luma推出新的图片训练方法,通过高效的推理时间计算扩展来克服算法上限

LBM,开源的图像到图像转换工具,支持对象移除、法线和深度估计以及对象重新照明



微信扫描下方的二维码阅读本文

2025.3.14 AI日报插图2

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。