E

Emotion Recognition Wav2vec2 IEMOCAP

由speechbrain開發
使用微調的wav2vec2模型進行語音情感識別,在IEMOCAP數據集上訓練
下載量 237.65k
發布時間 : 3/2/2022

模型概述

該模型通過分析語音信號識別說話人的情感狀態,採用wav2vec2架構結合卷積和殘差塊,使用注意力統計池化提取特徵

模型特點

高效特徵提取
利用wav2vec2預訓練模型提取語音特徵,結合注意力統計池化增強情感相關特徵
多情感分類
能夠識別多種情感狀態,在IEMOCAP數據集上達到78.7%的準確率
端到端處理
支持直接從原始音頻輸入進行情感分類,自動處理音頻標準化

模型能力

語音情感識別
音頻特徵提取
情感狀態分類

使用案例

人機交互
智能客服情緒分析
分析客戶語音中的情緒狀態,優化服務響應
可識別憤怒、高興等基本情緒狀態
心理健康
情緒狀態監測
通過日常語音分析用戶情緒變化
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase