V

Vit SO400M 14 SigLIP 384

由timm開發
基於WebLI數據集訓練的SigLIP(語言-圖像預訓練的Sigmoid損失)模型,適用於零樣本圖像分類任務。
下載量 158.84k
發布時間 : 10/16/2023

模型概述

該模型採用對比圖像-文本預訓練方法,通過Sigmoid損失函數優化,能夠實現高效的零樣本圖像分類。

模型特點

Sigmoid損失函數
採用Sigmoid損失進行語言圖像預訓練,提高了模型的對比學習效果。
零樣本分類能力
無需特定任務的微調即可直接應用於新的圖像分類任務。
高效視覺編碼
基於Vision Transformer架構,能夠高效提取圖像特徵。

模型能力

圖像特徵提取
零樣本圖像分類
多模態對比學習

使用案例

圖像理解
食品識別
識別圖像中的食品類別,如甜甜圈、貝奈特餅等。
可準確識別常見食品類別
動物識別
識別圖像中的動物類別,如貓、狗等。
對常見動物有較高識別準確率
內容審核
不當內容檢測
識別圖像中可能包含的不當內容。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase