开源模型 Megrez-3B-Omni,无问芯穹开源的全球首个端侧全模态理解模型,同时具备图片、文本、音频三种模态数据的理解分析能力 让我们看看演示视频吧! Megrez-3B-Omni,无问芯穹开源的全球首个端侧...
开源项目 Long Volumetric Video,多视角视频重建,能够处理长时间的视频,输入多视角视频,可以构建整个场景 让我们看看演示视频吧! Long Volumetric Video,多视角视频重...
开源项目 Mobile Video Diffusion,移动优化视频扩散模型,通过优化 Stable Video 的时空 UNet Diffusion (SVD) 中,我们减少了内存和计算需求 让我们看看演示视频吧! Mobile Video Diffusion,移动优化视...