J

Japanese Cloob Vit B 16

由rinna開發
由rinna株式會社訓練的日語CLOOB(對比留一增強)模型,用於圖像與文本的跨模態理解
下載量 229.51k
發布時間 : 4/27/2022

模型概述

該模型基於CLOOB架構,能夠理解日語文本與圖像之間的關聯,支持圖像分類和文本-圖像匹配等任務

模型特點

日語跨模態理解
專門針對日語設計的視覺-語言模型,能有效理解日語文本與圖像的關聯
CLOOB架構
採用對比留一增強(CLOOB)方法,提升跨模態表示學習效果
預訓練ViT模型
圖像編碼器基於AugReg vit-base-patch16-224模型初始化

模型能力

圖像特徵提取
文本特徵提取
圖像-文本匹配
跨模態檢索

使用案例

圖像分類
動物圖像分類
識別圖像中的動物類別(如犬、貓、象)
示例顯示對犬類圖像分類準確率達100%
跨模態檢索
文本到圖像檢索
根據日語文本描述檢索相關圖像
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase