W

W2v Speech Emotion Recognition

由Khoa開發
基於Wav2Vec2架構微調的英語語音情感識別模型,可識別六種情感狀態
下載量 147
發布時間 : 8/27/2024

模型概述

該模型專門用於識別英語語音中的情感狀態,包括悲傷、憤怒、厭惡、恐懼、快樂和中性。基於Wav2Vec2架構,在Kaggle語音情感識別數據集上進行了微調。

模型特點

多情感識別
能夠識別六種不同的情感狀態:悲傷、憤怒、厭惡、恐懼、快樂和中性
高準確率
在測試集上達到0.7435的準確率,特別在憤怒和中性情感識別上表現優異
基於Wav2Vec2架構
利用Wav2Vec2的強大特徵提取能力,適用於語音情感識別任務

模型能力

英語語音情感識別
六種情感分類
音頻特徵提取

使用案例

情感分析
客服語音分析
分析客戶服務通話中的客戶情緒
幫助識別不滿客戶並提高服務質量
心理健康監測
通過語音分析監測用戶情緒狀態
輔助心理健康評估和早期干預
人機交互
智能助手情緒響應
使智能助手能夠根據用戶語音情緒調整響應方式
提升人機交互的自然性和情感共鳴
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase