V

Vit So400m Patch14 Siglip Gap 896.pali Pt

Developed by timm
基于SigLIP图像编码器的视觉模型,采用全局平均池化,是PaliGemma项目的一部分
Downloads 15
Release Time : 12/26/2024

Model Overview

该模型是一个视觉特征提取模型,专注于图像理解任务,采用SigLIP架构并优化了全局平均池化处理

Model Features

SigLIP图像编码器
采用SigLIP架构的图像编码器,具有高效的视觉特征提取能力
全局平均池化
使用全局平均池化(GAP)技术优化特征表示
高分辨率处理
支持896像素的高分辨率图像输入

Model Capabilities

图像特征提取
视觉表示学习
图像理解

Use Cases

计算机视觉
图像分类
可用于构建图像分类系统
视觉问答
作为多模态模型的视觉编码组件
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase