X

Xlsr Wav2vec Speech Emotion Recognition

由harshit345開發
基於XLSR-Wav2Vec架構的語音情感識別模型,能夠識別五種基本情感:憤怒、厭惡、恐懼、快樂和悲傷。
下載量 498
發布時間 : 3/2/2022

模型概述

該模型使用Wav2Vec2架構進行語音情感分類,適用於從語音信號中識別說話者的情感狀態。

模型特點

多情感識別
能夠識別五種基本情感:憤怒、厭惡、恐懼、快樂和悲傷。
基於Wav2Vec2架構
利用Wav2Vec2的自監督學習能力,在語音情感識別任務上表現良好。
高準確率
在測試數據上整體準確率達到80.6%,各類情感識別表現均衡。

模型能力

語音情感分類
語音信號處理
情感概率評分

使用案例

人機交互
客服系統情感分析
分析客戶語音中的情感狀態,幫助客服系統做出更智能的響應。
可準確識別客戶憤怒、不滿等負面情緒
心理健康
情緒狀態監測
通過日常語音分析用戶的情緒變化。
可用於抑鬱症等心理疾病的輔助診斷
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase