V

Vit H 14 CLIPA 336 Datacomp1b

由UCSC-VLAA開發
CLIPA-v2模型,一種高效的對比式圖文模型,專注於零樣本圖像分類任務。
下載量 493
發布時間 : 10/17/2023

模型概述

該模型基於CLIPA-v2架構,通過對比學習實現圖像和文本的聯合表示,特別適用於零樣本圖像分類場景。

模型特點

高效零樣本分類
在有限預算下實現高精度的零樣本ImageNet分類(81.1%準確率)
反比例縮放優化
採用創新的訓練方法,實現計算資源與模型性能的高效平衡
大規模數據訓練
基於datacomp_1b數據集訓練,具有強大的泛化能力

模型能力

零樣本圖像分類
圖像-文本匹配
跨模態特徵提取

使用案例

圖像理解
零樣本圖像分類
無需特定訓練即可對新類別圖像進行分類
在ImageNet上達到81.1%準確率
內容審核
違規內容檢測
識別不符合規定的圖像內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase