V

Vit SO400M 16 SigLIP I18n 256

Developed by timm
一個在多語言WebLI數據集上訓練的SigLIP(語言圖像預訓練的Sigmoid損失)模型,支持多語言圖像分類任務。
Downloads 82
Release Time : 10/9/2024

Model Overview

該模型是基於SigLIP架構的對比圖像-文本模型,專門用於零樣本圖像分類任務,支持多語言處理。

Model Features

多語言支持
使用多語言分詞器訓練,支持多種語言的圖像分類任務。
Sigmoid損失函數
採用Sigmoid損失進行語言圖像預訓練,提高了模型的分類性能。
零樣本分類能力
無需特定訓練即可對新類別進行圖像分類。

Model Capabilities

零樣本圖像分類
多語言文本理解
圖像特徵提取

Use Cases

圖像分類
多語言圖像標籤
使用多語言文本標籤對圖像進行分類
可準確識別圖像內容並匹配多語言標籤
跨語言圖像搜索
使用不同語言查詢搜索相關圖像
實現跨語言的圖像檢索能力
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase