S

Siglip2 Large Patch16 256

由google開發
SigLIP 2 是基於 SigLIP 改進的視覺語言模型,整合了多項技術以提升語義理解、定位和密集特徵提取能力。
下載量 10.89k
發布時間 : 2/17/2025

模型概述

該模型可用於零樣本圖像分類、圖文檢索等任務,或作為視覺語言模型的視覺編碼器。

模型特點

增強的語義理解
整合了多項技術以提升語義理解能力。
改進的定位能力
通過新增訓練目標提升了定位能力。
密集特徵提取
能夠提取高質量的密集圖像特徵。
統一訓練方案
採用了一套統一的訓練方案,整合了多項獨立開發的技術。

模型能力

零樣本圖像分類
圖文檢索
圖像特徵提取

使用案例

圖像分類
零樣本圖像分類
無需微調即可對圖像進行分類。
圖文檢索
圖像搜索
根據文本描述檢索相關圖像。
視覺編碼
視覺特徵提取
作為視覺編碼器為其他視覺任務提供圖像特徵。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase