开源模型
Siglip 2,Google开源的多语言视觉语言模型,支持图片分类、图片-文字检索、为LLM提供视觉能力
Siglip 2,Google开源的多语言视觉语言模型,支持图片分类、图片-文字...
PaliGemma 2 mix,谷歌开源的升级版视觉语言模型,支持图像字幕,OCR,图像Q&A,对象检测和分割
PaliGemma 2 mix,谷歌开源的升级版视觉语言模型,支持图像字幕,OC...
R1 1776,Perplexity开源的无任何审查的DeepSeek-R1,可以提供未经审查、公正和真实的信息
R1 1776,Perplexity开源的无任何审查的DeepSeek-R1,可...