C

Cvt 13 384 In22k FV Finetuned Memes

由jayanta開發
基於microsoft/cvt-13-384-22k在圖像文件夾數據集上微調的圖像分類模型,在評估集上準確率達到83.46%
下載量 11
發布時間 : 10/21/2022

模型概述

該模型是微軟CVT架構的變體,專門針對圖像分類任務進行微調,特別適用於表情包分類場景。

模型特點

高準確率
在圖像分類任務上達到83.46%的準確率
基於CVT架構
採用微軟CVT視覺變換器架構,具有強大的特徵提取能力
微調優化
在特定數據集上進行精細調優,提升特定場景表現

模型能力

圖像分類
特徵提取
視覺模式識別

使用案例

內容分類
表情包分類
對互聯網表情包進行自動分類
準確率83.46%
內容審核
圖像內容識別
識別圖像中的特定內容類別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase