google-vit-base-patch16-224開源卡通情緒檢測模型

Google Vit Base Patch16 224 Cartoon Emotion Detection

由jayanta開發

基於Google Vision Transformer (ViT)架構微調的卡通圖像情緒分類模型，在測試集上達到88%準確率

下載量 25

發布時間 : 1/22/2023

模型概述

該模型專門用於識別卡通圖像中表達的情緒，基於ViT架構在自定義圖像數據集上微調而成

高準確率情緒識別

在測試集上達到88.07%的準確率和87.83%的F1值

基於ViT架構

使用Vision Transformer基礎模型，具有優秀的圖像特徵提取能力

端到端訓練

模型直接從原始像素學習特徵，無需複雜預處理

卡通圖像分類

情緒識別

圖像特徵提取

娛樂應用

卡通表情分析

分析卡通角色表情的情緒狀態

可識別多種基本情緒

內容審核

兒童內容過濾

識別卡通內容中的情緒傾向

屬性	詳情
模型類型	基於谷歌視覺變換器基礎模型（ViT-Base）微調的卡通表情檢測模型
訓練數據	imagefolder 數據集
評估指標	準確率、精確率、召回率、F1值