S

Siglip2 Giant Opt Patch16 384

由google開發
SigLIP 2 是基於 SigLIP 預訓練目標的改進模型,整合了多項技術以提升語義理解、定位和密集特徵提取能力。
下載量 26.12k
發布時間 : 2/17/2025

模型概述

SigLIP 2 是一個視覺語言模型,可用於零樣本圖像分類和圖文檢索等任務,也可作為視覺編碼器用於其他視覺任務。

模型特點

改進的語義理解
整合了多項技術,顯著提升了語義理解能力。
增強的定位能力
通過特定訓練目標,提高了模型的定位精度。
密集特徵提取
能夠提取更豐富的密集特徵,適用於多種視覺任務。
多任務適應性
支持零樣本圖像分類和圖文檢索等多種任務。

模型能力

零樣本圖像分類
圖文檢索
視覺特徵提取

使用案例

圖像分類
零樣本圖像分類
無需特定訓練即可對新類別圖像進行分類。
高準確率的零樣本分類性能
信息檢索
圖文檢索
根據文本查詢檢索相關圖像,或根據圖像檢索相關文本。
高效的跨模態檢索能力
視覺編碼
視覺特徵提取
作為其他視覺任務的視覺編碼器,提供高質量的特徵表示。
豐富的視覺特徵表示
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase