V

Vit B 16 SigLIP2 512

Developed by timm
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类任务
Downloads 1,442
Release Time : 2/21/2025

Model Overview

这是一个对比图像-文本模型,专为零样本图像分类设计,能够理解图像内容并匹配文本描述

Model Features

Sigmoid损失函数
采用创新的Sigmoid损失进行语言图像预训练,提高模型性能
多语言支持
支持多语言文本理解,增强跨语言应用能力
改进的语义理解
相比前代模型,在语义理解和定位能力上有显著提升

Model Capabilities

零样本图像分类
图像-文本匹配
多模态特征提取

Use Cases

图像理解
零样本图像分类
无需特定训练即可对图像进行分类
示例中显示能准确识别贝奈特饼等食物
多模态应用
图像搜索
通过文本描述搜索相关图像
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase