V

Vit SO400M 16 SigLIP I18n 256

由timm開發
一個在多語言WebLI數據集上訓練的SigLIP(語言圖像預訓練的Sigmoid損失)模型,支持多語言圖像分類任務。
下載量 82
發布時間 : 10/9/2024

模型概述

該模型是基於SigLIP架構的對比圖像-文本模型,專門用於零樣本圖像分類任務,支持多語言處理。

模型特點

多語言支持
使用多語言分詞器訓練,支持多種語言的圖像分類任務。
Sigmoid損失函數
採用Sigmoid損失進行語言圖像預訓練,提高了模型的分類性能。
零樣本分類能力
無需特定訓練即可對新類別進行圖像分類。

模型能力

零樣本圖像分類
多語言文本理解
圖像特徵提取

使用案例

圖像分類
多語言圖像標籤
使用多語言文本標籤對圖像進行分類
可準確識別圖像內容並匹配多語言標籤
跨語言圖像搜索
使用不同語言查詢搜索相關圖像
實現跨語言的圖像檢索能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase