V

Vit L 16 SigLIP 256

由timm開發
基於WebLI數據集訓練的SigLIP(語言圖像預訓練的Sigmoid損失)模型,用於零樣本圖像分類任務。
下載量 1,516
發布時間 : 10/16/2023

模型概述

該模型是一個對比圖像-文本模型,採用Sigmoid損失函數進行預訓練,支持零樣本圖像分類任務。

模型特點

Sigmoid損失函數
採用Sigmoid損失函數進行語言圖像預訓練,提高了模型的對比學習效果。
零樣本分類
支持零樣本圖像分類,無需特定任務的微調即可應用於新類別。
多框架支持
同時支持OpenCLIP(圖像+文本)和timm(僅圖像)框架,使用靈活。

模型能力

圖像特徵提取
文本特徵提取
零樣本圖像分類
圖像-文本對比學習

使用案例

圖像分類
零樣本圖像分類
無需微調即可對新的圖像類別進行分類。
圖像檢索
基於文本的圖像檢索
根據文本描述檢索相關圖像。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase