V

Vit H 14 CLIPA 336 Laion2b

由UCSC-VLAA開發
CLIPA-v2模型,基於laion2B-en數據集訓練,專注於零樣本圖像分類任務
下載量 74
發布時間 : 10/17/2023

模型概述

這是一個對比圖像-文本模型,能夠執行零樣本圖像分類任務,特別適合在沒有特定類別訓練數據的情況下進行圖像分類

模型特點

零樣本學習能力
無需特定類別的訓練數據即可進行分類
高效訓練
以相對較低的預算實現高性能(論文中提到10,000美元預算達到81.1%準確率)
逆縮放定律
採用創新的訓練方法,實現更好的性能擴展

模型能力

零樣本圖像分類
圖像-文本對比學習
多類別圖像識別

使用案例

圖像分類
通用物體識別
識別圖像中的常見物體類別
在ImageNet上達到81.1%的零樣本準確率
內容審核
識別圖像中的不適當內容
多媒體檢索
圖像搜索
通過文本查詢檢索相關圖像
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase