V

Vit So400m Patch14 Siglip Gap 896.pali2 3b Pt

由timm開發
基於SigLIP圖像編碼器的視覺模型,採用全局平均池化,是PaliGemma2項目的一部分
下載量 14
發布時間 : 12/26/2024

模型概述

該模型是一個視覺模型,專注於圖像特徵提取,採用SigLIP圖像編碼器架構,並使用了全局平均池化技術。

模型特點

SigLIP圖像編碼器
採用SigLIP架構的圖像編碼器,專注於高效的圖像特徵提取
全局平均池化
使用全局平均池化技術,有助於提取圖像的全局特徵
PaliGemma2項目
作為PaliGemma2項目的一部分,可能與其他組件協同工作

模型能力

圖像特徵提取
視覺表示學習

使用案例

計算機視覺
圖像分類
可用於圖像分類任務,提取圖像特徵供分類器使用
視覺問答
作為視覺問答系統的視覺編碼組件
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase