PaliGemma 2 mix,谷歌开源的升级版视觉语言模型,支持图像字幕,OCR,图像Q&A,对象检测和分割,有3B,10B,28B参数的尺寸。

PaliGemma 2 mix,谷歌开源的升级版视觉语言模型,支持图像字幕,OCR,图像Q&A,对象检测和分割插图

官方博文:https://developers.googleblog.com/en/introducing-paligemma-2-mix/

模型下载地址:https://huggingface.co/collections/google/paligemma-2-mix-67ac6a251aaf3ee73679dcc4



微信扫描下方的二维码阅读本文

PaliGemma 2 mix,谷歌开源的升级版视觉语言模型,支持图像字幕,OCR,图像Q&A,对象检测和分割插图1

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。