V

Vit H 14 CLIPA Datacomp1b

由UCSC-VLAA開發
CLIPA-v2模型,一個高效的對比式圖文模型,專為零樣本圖像分類任務設計。
下載量 65
發布時間 : 10/17/2023

模型概述

該模型是一個基於CLIPA-v2架構的對比式圖文模型,主要用於零樣本圖像分類任務。它通過對比學習將圖像和文本映射到同一特徵空間,實現無需特定任務訓練的零樣本分類能力。

模型特點

高效零樣本分類
無需特定任務訓練即可實現圖像分類
大規模數據訓練
基於mlfoundations/datacomp_1b數據集訓練
高準確率
在ImageNet上實現81.1%的零樣本準確率
成本效益高
以較低預算實現高性能

模型能力

零樣本圖像分類
圖像-文本匹配
多模態特徵提取

使用案例

圖像分類
零樣本物體識別
無需訓練即可識別新類別的物體
示例中準確識別了法式甜甜圈
多模態應用
圖像搜索
通過文本查詢搜索相關圖像
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase