W

Wav2vec2 Xlsr English Speech Emotion Recognition

由AreejB開發
該模型用於從英語音頻中識別六種基本情緒:憤怒、厭惡、恐懼、快樂、悲傷和驚訝,基於RAVDESS數據集訓練。
下載量 82
發布時間 : 5/10/2024

模型概述

採用Wav2Vec2架構的英語語音情感識別模型,能夠從音頻錄音中提取情感特徵並進行分類。

模型特點

多情感識別
能夠識別六種基本情緒:憤怒、厭惡、恐懼、快樂、悲傷和驚訝
基於Wav2Vec2架構
利用預訓練的Wav2Vec2模型進行微調,具有良好的語音特徵提取能力
高準確率
在測試集上平均準確率達到84.84%,部分情感識別精確率超過90%

模型能力

英語語音情感識別
音頻特徵提取
多分類情感分析

使用案例

人機交互
智能客服情緒分析
分析客戶語音中的情緒狀態,提升服務質量
可識別憤怒、快樂等關鍵情緒,幫助客服及時調整策略
心理健康
情緒狀態監測
通過語音分析用戶情緒變化
可識別悲傷、恐懼等負面情緒,輔助心理評估
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase