ml_mdm 是一个用于高分辨率图像和视频合成的端到端框架,它以我们的技术命名:Matryoshka Diffusion Models.

值得注意的是,我们可以在高达 1024x1024 像素的分辨率下训练单个像素空间模型,使用 CC12M 数据集(仅包含 1200 万张图像)展示了强大的零样本泛化。

ml-mdm,苹果开源的图像生成模型插图

Github地址:https://github.com/apple/ml-mdm



微信扫描下方的二维码阅读本文

ml-mdm,苹果开源的图像生成模型插图1

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。