E

Eva02 Large Patch14 Clip 224.merged2b S4b B131k

由timm開發
EVA02是一個基於CLIP架構的大規模視覺語言模型,支持零樣本圖像分類任務。
下載量 5,696
發布時間 : 4/10/2023

模型概述

該模型是基於CLIP架構的視覺語言模型,專注於零樣本圖像分類任務。它通過聯合訓練圖像和文本編碼器,實現了強大的跨模態理解能力。

模型特點

零樣本學習能力
無需特定任務訓練即可執行圖像分類任務
跨模態理解
能夠同時處理和理解視覺和文本信息
大規模預訓練
基於大規模數據集進行預訓練,具有強大的泛化能力

模型能力

零樣本圖像分類
圖像-文本匹配
跨模態檢索

使用案例

計算機視覺
圖像分類
對圖像進行分類而無需特定類別訓練
在多種基準測試中表現良好
內容審核
識別圖像中的不當內容
電子商務
產品分類
自動分類電商平臺上的產品圖片
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase