C

CLIP Convnext Large D.laion2b S26b B102k Augreg

由laion開發
基於LAION-2B數據集訓練的大規模ConvNeXt-Large CLIP模型,支持零樣本圖像分類和圖文檢索任務
下載量 80.74k
發布時間 : 1/29/2023

模型概述

該模型採用ConvNeXt-Large架構,通過增強數據增廣與正則化技術訓練,在ImageNet零樣本分類任務中達到75.9%準確率

模型特點

ConvNeXt架構創新
首批大規模訓練的ConvNeXt CLIP模型,相比傳統ViT架構在計算效率上有顯著提升
增強數據增廣
採用隨機縮放裁剪(RRC)、隨機擦除(RE)、隨機深度(SD)等先進正則化技術提升模型魯棒性
高效訓練
在256分辨率下僅用ViT-L/16一半的計算量即實現更高性能

模型能力

零樣本圖像分類
圖文相似度計算
跨模態檢索

使用案例

圖像理解
零樣本圖像分類
無需微調即可對新圖像進行分類
ImageNet-1k零樣本準確率75.9%
跨模態檢索
圖文檢索
根據文本搜索相關圖像或根據圖像生成描述
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase