M

Metaclip L14 Fullcc2.5b

由facebook開發
MetaCLIP是基於CommonCrawl(CC)25億數據點訓練的大規模視覺-語言模型,解密了CLIP的數據篩選方法
下載量 172
發布時間 : 10/9/2023

模型概述

該模型構建圖像-文本共享嵌入空間,支持零樣本圖像分類、跨模態檢索等任務

模型特點

數據解密技術
揭示了CLIP訓練數據篩選方法,填補了OpenAI未公開的技術空白
大規模訓練
基於CommonCrawl的25億數據點訓練,覆蓋廣泛視覺概念
高分辨率處理
支持14×14圖像塊分辨率,保留更多視覺細節

模型能力

零樣本圖像分類
基於文本的圖像檢索
基於圖像的文本檢索
跨模態特徵提取

使用案例

內容檢索
多模態搜索引擎
通過自然語言查詢檢索相關圖像內容
智能分類
零樣本圖像分類
無需特定類別訓練數據即可完成新類別識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase