S

Speech Emotion Recognition With Facebook Wav2vec2 Large Xlsr 53

由firdhokk開發
基於Wav2Vec2 Large XLSR-53模型微調的語音情感識別系統,能夠識別7種常見情感
下載量 66
發布時間 : 9/20/2024

模型概述

該模型通過微調Wav2Vec2 Large XLSR-53實現語音情感分類,支持憤怒、厭惡、恐懼、快樂、中性、悲傷和驚訝7種情感識別

模型特點

高準確率情感識別
在測試集上達到91.68%的準確率和91.66%的F1值
多數據集訓練
融合RAVDESS、SAVEE、TESS和URDU多個數據集進行訓練
高效特徵提取
使用Wav2Vec2特徵提取器處理音頻數據,實現標準化特徵輸入

模型能力

語音情感識別
音頻分類
多情感分類

使用案例

人機交互
智能客服情緒分析
分析客戶語音中的情緒狀態
提升客服響應質量和用戶體驗
心理健康
情緒狀態監測
通過語音分析用戶情緒變化
輔助心理健康評估
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase