V

Vit L 14 CLIPA Datacomp1b

由UCSC-VLAA開發
CLIPA-v2模型,一種高效的對比式圖文模型,專注於零樣本圖像分類任務。
下載量 278
發布時間 : 10/17/2023

模型概述

該模型是基於CLIPA-v2架構的對比式圖文模型,主要用於零樣本圖像分類。它通過大規模數據集訓練,能夠在不進行特定任務微調的情況下,直接對圖像進行分類。

模型特點

高效零樣本分類
能夠在沒有特定任務微調的情況下,直接對圖像進行分類。
大規模數據集訓練
使用mlfoundations/datacomp_1b數據集進行訓練,具備強大的泛化能力。
低成本高性能
以較低的訓練成本實現高準確率的零樣本圖像分類。

模型能力

零樣本圖像分類
圖文對比學習
多語言支持

使用案例

圖像分類
零樣本圖像分類
直接對未見過類別的圖像進行分類,無需微調。
在零樣本ImageNet分類任務中達到81.1%的準確率。
多模態應用
圖文檢索
根據文本描述檢索相關圖像,或根據圖像生成相關文本描述。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase