V

Vit B 16 Aion400m E32 1finetuned 1

由Albe-njupt開發
基於OpenCLIP框架的視覺Transformer模型,針對零樣本圖像分類任務進行微調
下載量 18
發布時間 : 3/4/2024

模型概述

該模型是基於Vision Transformer (ViT)架構的視覺語言模型,使用AION-400M數據集進行訓練和微調,擅長零樣本圖像分類任務。

模型特點

零樣本學習能力
無需特定類別訓練即可對新類別進行圖像分類
大規模預訓練
基於AION-400M大規模數據集進行預訓練和微調
視覺語言對齊
通過對比學習實現圖像和文本特徵的聯合嵌入

模型能力

零樣本圖像分類
圖像-文本匹配
跨模態檢索

使用案例

內容分類
社交媒體內容自動標記
自動為上傳的圖片添加相關標籤
提高內容分類效率,減少人工標註成本
電子商務
商品圖像自動分類
根據商品圖片自動歸類到相應品類
提升商品上架效率,優化搜索體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase