C

CLIP ViT B 16 DataComp.XL S13b B90k

由flavour開發
這是一個基於 DataComp-1B 數據集訓練的 CLIP ViT-L/14 模型,支持零樣本圖像分類和圖像文本檢索任務。
下載量 39.22k
發布時間 : 7/27/2023

模型概述

該模型使用 OpenCLIP 框架在 DataComp-1B 數據集上訓練,主要用於研究零樣本圖像分類和跨模態檢索任務。

模型特點

大規模訓練數據
使用 DataComp-1B 數據集的 14 億樣本進行訓練
零樣本能力
無需微調即可執行多種圖像分類任務
跨模態理解
能夠理解圖像和文本之間的關聯

模型能力

零樣本圖像分類
圖像文本檢索
跨模態理解

使用案例

研究
零樣本圖像分類研究
探索模型在不同分類體系下的表現
在 ImageNet-1k 上達到 79.2% 的零樣本 top-1 準確率
內容管理
圖像檢索
基於文本描述檢索相關圖像
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase