E

Eva02 Enormous Patch14 Clip 224.laion2b

由timm開發
EVA-CLIP是一個基於CLIP架構的視覺-語言模型,支持零樣本圖像分類任務。
下載量 38
發布時間 : 12/26/2024

模型概述

該模型是基於CLIP架構的視覺-語言模型,能夠理解圖像和文本之間的關係,適用於零樣本圖像分類等任務。

模型特點

零樣本學習
支持零樣本圖像分類,無需特定任務的訓練數據即可進行分類。
視覺-語言對齊
通過聯合訓練圖像和文本編碼器,實現視覺和語言模態的對齊。
高性能
在多個基準數據集上表現出色,具有較高的分類準確率。

模型能力

零樣本圖像分類
圖像-文本匹配
視覺-語言理解

使用案例

圖像分類
零樣本圖像分類
使用自然語言描述對圖像進行分類,無需特定任務的訓練數據。
視覺-語言任務
圖像-文本匹配
判斷圖像和文本描述是否匹配。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase