V

Vit Facial Expression Recognition

由mo-thecreator開發
基於ViT的面部表情識別模型,在FER2013、MMI和AffectNet數據集上微調,支持七種情緒分類
下載量 8,730
發布時間 : 4/29/2024

模型概述

該模型是基於視覺Transformer(ViT)架構的面部情緒識別模型,專門針對七種基本情緒進行分類,包括憤怒、厭惡、恐懼、高興、悲傷、驚訝和中性。

模型特點

多數據集融合訓練
結合FER2013、MMI和AffectNet三個面部表情數據集進行訓練,提高模型泛化能力
高效視覺Transformer架構
採用ViT基礎架構,通過16x16圖像塊處理,在224x224分辨率下實現高效特徵提取
優化的訓練策略
使用餘弦退火學習率調度和預熱策略,配合Adam優化器實現穩定訓練

模型能力

面部情緒識別
七種基本情緒分類
靜態圖像情感分析

使用案例

人機交互
情感感知系統
用於智能設備的情感感知界面,根據用戶表情調整交互方式
準確率84.34%
心理健康
情緒狀態監測
輔助心理醫生或護理人員監測患者的情緒變化
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase