S

Siglip2 So400m Patch16 384

由google開發
SigLIP 2 是基於 SigLIP 預訓練目標的改進模型,整合了多項技術以提升語義理解、定位和密集特徵提取能力。
下載量 7,632
發布時間 : 2/17/2025

模型概述

該模型可直接用於零樣本圖像分類、圖文檢索等任務,或作為視覺語言模型的視覺編碼器。

模型特點

增強的語義理解
整合了多項技術以提升語義理解能力,包括解碼器損失、全局-局部與掩碼預測損失等。
零樣本圖像分類
支持無需特定訓練即可對圖像進行分類,適用於多種場景。
密集特徵提取
能夠提取圖像的密集特徵,適用於視覺語言模型和其他視覺任務。

模型能力

零樣本圖像分類
圖文檢索
視覺編碼

使用案例

圖像分類
零樣本圖像分類
無需特定訓練即可對圖像進行分類,適用於多種場景。
高準確率的零樣本分類效果
視覺編碼
視覺語言模型
作為視覺編碼器,為視覺語言模型提供圖像特徵。
高效的圖像特徵提取
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase