S

Siglip2 So400m Patch14 384

由google開發
SigLIP 2 是基於 SigLIP 預訓練目標的視覺語言模型,整合了多項技術以提升語義理解、定位和密集特徵提取能力。
下載量 622.54k
發布時間 : 2/17/2025

模型概述

該模型可用於零樣本圖像分類、圖文檢索等任務,也可作為視覺語言模型的視覺編碼器。

模型特點

增強的語義理解
整合了多項技術以提升語義理解能力
定位能力
改進的定位能力有助於更精確的圖像分析
密集特徵提取
能夠提取更豐富的圖像特徵
統一訓練方案
整合了先前獨立開發的技術,形成統一訓練方案

模型能力

零樣本圖像分類
圖文檢索
視覺特徵提取

使用案例

圖像分析
零樣本圖像分類
無需訓練即可對新類別圖像進行分類
圖文檢索
根據文本查詢檢索相關圖像
計算機視覺
視覺編碼器
作為其他視覺語言模型的視覺編碼組件
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase