让我们看看演示视频吧!
Magma,微软推出的多模式AI代理的基础模型,具备UI导航、机器人操作、图像/视频理解,能在电脑界面上点击按钮、填表格等操作,也能控制机器人手臂做一些比如抓取物体的操作。
项目地址:https://microsoft.github.io/Magma/
Github地址:https://github.com/microsoft/Magma
论文地址:https://www.arxiv.org/pdf/2502.13130
微信扫描下方的二维码阅读本文
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)