C

CLIP ViT L 14 Spectrum Icons 20k

由JianLiao開發
基於CLIP ViT-L/14微調的視覺語言模型,專為抽象圖像-文本檢索任務優化
下載量 1,576
發布時間 : 1/5/2025

模型概述

該模型在23,000個抽象圖像-文本對上微調,提升了文本到圖像和圖像到文本檢索性能,特別適合處理抽象視覺特徵

模型特點

抽象視覺特徵理解
通過專用數據集微調,增強了對抽象圖標和符號的理解能力
高效檢索能力
在圖像-文本雙向檢索任務中R@1達到70%,R@5超過96%
領域適應性
保持基礎模型泛化能力的同時,優化了特定領域的表現

模型能力

零樣本圖像分類
文本到圖像檢索
圖像到文本檢索
抽象視覺特徵匹配

使用案例

信息檢索
圖標庫搜索
通過自然語言描述檢索匹配的圖標圖像
R@1準確率約70%
內容管理
自動圖像標註
為抽象圖標生成描述性文本標籤
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase