L

Llm Jp Clip Vit Base Patch16

由llm-jp開發
日語CLIP模型,基於OpenCLIP框架訓練,支持零樣本圖像分類任務
下載量 40
發布時間 : 12/17/2024

模型概述

這是一個日語視覺語言模型,能夠將圖像與日語文本進行關聯,特別適用於零樣本圖像分類任務。模型在14.5億日語圖文對數據集上訓練,總參數量為248M。

模型特點

日語專用
專門針對日語優化的CLIP模型,在日語文本理解方面表現優異
大規模訓練數據
使用14.5億日語圖文對數據集訓練,覆蓋廣泛視覺概念
零樣本能力
無需特定訓練即可執行新類別的圖像分類任務

模型能力

零樣本圖像分類
圖像-文本匹配
跨模態檢索

使用案例

圖像分類
日語標籤圖像分類
使用日語文本標籤對圖像進行分類
在ImageNet日語分類任務上達到54.2%準確率
跨模態檢索
圖像搜索
使用日語文本查詢檢索相關圖像
在XM3600數據集上圖到文檢索任務中達到73.6%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase