L

Llm Jp Clip Vit Large Patch14

由llm-jp開發
基於OpenCLIP框架訓練的日語CLIP模型,在14.5億日文圖文對數據集上訓練,支持零樣本圖像分類和圖文檢索任務
下載量 254
發布時間 : 12/27/2024

模型概述

這是一個日語視覺語言模型,能夠將圖像和日文文本映射到共享的嵌入空間,實現零樣本圖像分類和跨模態檢索功能

模型特點

大規模日語訓練數據
使用15億日文圖文對數據集訓練,通過高質量機器翻譯獲得
高性能視覺語言理解
在多個基準測試中表現優異,尤其在日本文化相關任務上
零樣本分類能力
無需特定任務微調即可執行圖像分類任務

模型能力

零樣本圖像分類
圖文相似度計算
跨模態檢索
圖像語義理解

使用案例

內容審核
違規內容檢測
通過文本描述檢測圖像中的違規內容
電子商務
商品搜索
通過自然語言描述查找相關商品圖片
媒體分析
圖像標註
自動為圖像生成日文描述標籤
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase