S

Siglip2 Base Patch16 Naflex

由google開發
SigLIP 2 是一個多語言視覺-語言編碼器,整合了SigLIP的預訓練目標並增加了新的訓練方案,提升了語義理解、定位和密集特徵提取能力。
下載量 10.68k
發布時間 : 2/18/2025

模型概述

SigLIP 2 可用於零樣本圖像分類、圖文檢索等任務,或作為視覺語言模型的視覺編碼器。

模型特點

增強的語義理解
整合了SigLIP的預訓練目標並增加了新的訓練方案,提升了語義理解能力。
定位和密集特徵提取
通過改進的訓練目標,增強了定位和密集特徵提取能力。
多任務支持
支持零樣本圖像分類、圖文檢索等多種視覺-語言任務。

模型能力

零樣本圖像分類
圖文檢索
視覺編碼

使用案例

圖像分類
零樣本圖像分類
無需微調即可對圖像進行分類,支持自定義標籤。
圖文檢索
圖像搜索
根據文本描述檢索相關圖像。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase