V

Vit So400m Patch14 Siglip 378.webli

由timm開發
基於SigLIP的視覺Transformer模型,僅包含圖像編碼器,採用原始注意力池化機制。
下載量 82
發布時間 : 12/24/2024

模型概述

該模型是一個視覺Transformer模型,專注於圖像特徵提取,採用SigLIP架構,適用於各種計算機視覺任務。

模型特點

SigLIP架構
採用SigLIP架構,專注於高效的圖像特徵提取。
原始注意力池化
使用原始注意力池化機制,提高特徵提取的準確性。
大模型規模
具有400M參數的大規模模型,能夠處理複雜的視覺任務。

模型能力

圖像特徵提取
視覺表示學習

使用案例

計算機視覺
圖像分類
可用於圖像分類任務,提取高質量的特徵表示。
目標檢測
作為特徵提取器,支持目標檢測任務。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase