让我们看看演示视频吧!

LLaMA-Mesh,清华大学和英伟达推出的文本生成3D模型,使大型语言模型 (LLMs) 能够通过将 3D 网格表示为文本并进行微调来输入和生成 3D 网格。这将 3D 和文本模态统一到单个模型中,并保留了语言能力,从而通过网格理解解锁对话式 3D 创建。

项目地址:https://research.nvidia.com/labs/toronto-ai/LLaMA-Mesh/

Github地址:https://github.com/nv-tlabs/LLaMa-Mesh

论文地址:https://arxiv.org/abs/2411.09595



微信扫描下方的二维码阅读本文

LLaMA-Mesh,清华大学和英伟达推出的文本生成3D模型插图

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。