C

CLIP ViT G 14 Laion2b S34b B88k

由laion開發
基於LAION-2B數據集訓練的CLIP ViT-g/14模型,支持零樣本圖像分類和圖文檢索任務
下載量 76.65k
發布時間 : 3/6/2023

模型概述

這是一個基於LAION-5B英語子集LAION-2B訓練的CLIP ViT-g/14模型,使用OpenCLIP框架實現,主要用於零樣本圖像分類和圖文檢索等任務。

模型特點

大規模訓練
使用LAION-2B數據集(20億樣本)進行訓練,具有強大的泛化能力
零樣本學習
無需特定任務微調即可執行圖像分類和檢索任務
高性能
在ImageNet-1k上達到78.4%的零樣本top-1準確率

模型能力

零樣本圖像分類
圖文檢索
圖像特徵提取
文本特徵提取

使用案例

計算機視覺
圖像分類
無需訓練即可對圖像進行分類
在ImageNet-1k上達到78.4%準確率
圖像搜索
基於文本描述搜索相關圖像
研究
多模態學習研究
用於研究視覺-語言聯合表示學習
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase