V

Vit Base Patch16 Siglip Gap 224.webli

Developed by timm
基于SigLIP的视觉Transformer模型,仅包含图像编码器部分,采用全局平均池化策略
Downloads 178
Release Time : 12/24/2024

Model Overview

该模型是SigLIP框架中的视觉编码器组件,专为图像特征提取设计,适用于需要高效视觉表示的任务

Model Features

SigLIP优化架构
采用SigLIP框架的改进视觉Transformer结构,优化了图像表示能力
全局平均池化
使用全局平均池化(GAP)替代传统CLS token,可能提升特征稳定性
高效特征提取
专为图像特征提取任务优化,输出紧凑的视觉表示向量

Model Capabilities

图像特征提取
视觉表示学习
图像内容分析

Use Cases

计算机视觉
图像检索系统
提取图像特征用于相似性搜索
高效生成紧凑的图像表示向量
多模态学习
作为视觉编码器与其他模态模型配合使用
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase