让我们看看官方演示视频吧!

Sapiens 为以人为中心的视觉任务(例如 2D 姿势、零件分割、深度、法线等)提供了一套全面的套件。该模型系列在 3 亿张野外人类图像上进行了预训练,并显示出对不受约束条件的出色泛化。这些模型还设计用于提取高分辨率特征,以 1024 x 1024 图像分辨率和 16 像素的补丁大小进行本机训练。

项目地址:https://about.meta.com/realitylabs/codecavatars/sapiens/

Github地址:https://github.com/facebookresearch/sapiens

论文地址:https://arxiv.org/abs/2408.12569



微信扫描下方的二维码阅读本文

sapiens,Meta开源的人体视觉模型,分析和理解图片或视频中的人和他们的动作插图

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。