开源模型
关于AI的开源的模型
Emu3,智源研究院开源的多模态大模型,通过预测下一个词或token的方式来理解和生成文本、图像和视频
Emu3,智源研究院开源的多模态大模型,通过预测下一个词或token的方式来理解...
Flux.1-dev ControlNets,新增Upscaler、depth、surface normal三种ControlNet
Flux.1-dev ControlNets,新增Upscaler、depth、...
EzAudio,开源的AI音频生成模型,基于Diffusion Transformer 增强文本到音频的生成
让我们听听演示音频吧! EzAudio 是一种高级文本到音频 (T2A) 生成模...