S

Siglip2 Large Patch16 512

由 google 开发
SigLIP 2 是基于 SigLIP 的改进模型,整合了多项技术以提升语义理解、定位和密集特征提取能力。
下载量 4,416
发布时间 : 2/17/2025

模型简介

SigLIP 2 是一个视觉语言模型,可用于零样本图像分类和图文检索等任务,也可作为其他视觉任务的视觉编码器。

模型特点

改进的语义理解
整合了多项技术以提升语义理解能力
增强的定位能力
改进了图像中对象的定位能力
密集特征提取
能够提取更丰富的密集特征
多任务适应性
支持零样本分类和图文检索等多种任务

模型能力

零样本图像分类
图文检索
视觉特征提取

使用案例

图像理解
零样本图像分类
无需特定训练即可对图像进行分类
支持自定义候选标签进行分类
图文检索
根据文本查询检索相关图像
计算机视觉
视觉编码器
作为其他视觉任务的视觉特征提取器
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase