Diffusion E2E FT,基于扩散模型生成图片的深度图,改进了算法,速度快了200倍。

左图:我们的方法对野外图像的深度和法向预测。右:DDIM 调度器的简单修复支持对最近基于扩散的深度估计器进行单步推理;简单的端到端微调在速度和准确性上优于更复杂的扩散基线。

Diffusion E2E FT,基于扩散模型生成图片的深度图插图

项目地址:https://gonzalomartingarcia.github.io/diffusion-e2e-ft/

Github地址:https://github.com/VisualComputingInstitute/diffusion-e2e-ft

论文地址:https://arxiv.org/abs/2409.11355

在线体验:https://huggingface.co/spaces/GonzaloMG/marigold-e2e-ft-normals



微信扫描下方的二维码阅读本文

Diffusion E2E FT,基于扩散模型生成图片的深度图插图1

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。