让我们看看演示视频吧!

Magma,微软推出的多模式AI代理的基础模型,具备UI导航、机器人操作、图像/视频理解,能在电脑界面上点击按钮、填表格等操作,也能控制机器人手臂做一些比如抓取物体的操作。

项目地址:https://microsoft.github.io/Magma/

Github地址:https://github.com/microsoft/Magma

论文地址:https://www.arxiv.org/pdf/2502.13130



微信扫描下方的二维码阅读本文

Magma,微软推出的多模式AI代理的基础模型插图

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。