C

CLIP ViT B 32 DataComp.XL S13b B90k

由laion開發
這是一個基於 DataComp-1B 數據集訓練的 CLIP ViT-B/32 模型,用於零樣本圖像分類和圖像文本檢索等任務。
下載量 12.12k
發布時間 : 9/29/2023

模型概述

該模型使用 OpenCLIP 框架在 DataComp-1B 數據集上訓練,旨在為研究社區提供研究輸出,幫助探索零樣本、任意圖像分類。

模型特點

大規模數據訓練
使用 DataComp-1B 數據集的 14 億樣本進行訓練,覆蓋廣泛的視覺概念。
零樣本能力
無需特定任務微調即可執行圖像分類和檢索任務。
研究友好
專為研究社區設計,支持跨學科研究和潛在影響分析。

模型能力

零樣本圖像分類
圖像文本檢索
跨模態理解
圖像特徵提取

使用案例

研究應用
零樣本圖像分類研究
探索模型在不同類別分類法下的性能表現
在 ImageNet-1k 上實現 72.7% 的零樣本 top-1 準確率
跨模態理解研究
研究視覺和語言模態之間的關聯學習
潛在應用
圖像搜索系統
基於文本查詢檢索相關圖像
內容審核輔助
識別圖像中的潛在有害內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase