S

Speech Emotion Recognition Wav2vec2 Large Xlsr 53 240304 SER Fine Tuned2.0

由hughlan1214開發
基於wav2vec2-large-xlsr-53的語音情感識別模型,支持7種情感分類
下載量 145
發布時間 : 3/4/2024

模型概述

該模型通過微調facebook/wav2vec2-large-xlsr-53實現,能夠識別語音中的7種情感類型(憤怒、厭惡、恐懼、快樂、中性、悲傷、驚訝),為多模態情緒分析提供基礎。

模型特點

跨語言能力
儘管僅使用英文數據訓練,但模型在中文和法語情感識別上也表現良好
多情感分類
可識別7種不同的人類基本情感狀態
多數據集融合訓練
基於Crema、Ravdess、Savee和Tess四個主流語音情感數據集的融合數據訓練

模型能力

語音情感識別
跨語言情感分析
即時情緒推斷

使用案例

人機交互
智能客服情緒分析
即時分析客戶語音中的情緒狀態
提升客服響應質量和用戶體驗
心理健康
情緒狀態監測
通過語音分析用戶情緒變化
輔助心理健康評估
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase