V

Vit Bigg 14 CLIPA Datacomp1b

由UCSC-VLAA開發
CLIPA-v2模型,專注於零樣本圖像分類任務,通過對比式圖文訓練實現高效視覺表示學習
下載量 623
發布時間 : 10/20/2023

模型概述

這是一個基於CLIPA-v2架構的對比式圖文模型,專門用於零樣本圖像分類任務。它通過在大規模數據集上訓練,能夠理解圖像和文本之間的關聯,實現無需特定訓練的分類能力。

模型特點

高效零樣本學習
無需特定任務訓練即可實現圖像分類
低成本高性能
以相對較低的訓練成本實現81.1%的零樣本ImageNet準確率
逆縮放定律
採用CLIPA訓練的逆縮放定律,優化模型性能與計算資源的平衡

模型能力

零樣本圖像分類
圖文對比學習
跨模態表示學習

使用案例

計算機視覺
圖像分類
對任意圖像進行分類而無需特定訓練
在ImageNet上達到81.1%的零樣本準確率
圖文檢索
根據文本描述檢索相關圖像或反之
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase