W

Wav2vec2 Lg Xlsr En Speech Emotion Recognition

由ehcalabres開發
基於Wav2Vec 2.0微調的語音情感識別模型,支持識別8種英語情感,在RAVDESS數據集上準確率達82.23%
下載量 39.83k
發布時間 : 3/2/2022

模型概述

該模型是基於jonatasgrosman/wav2vec2-large-xlsr-53-english微調而成的語音情感識別(SER)模型,專門用於識別英語語音中的8種不同情感。

模型特點

高準確率
在RAVDESS數據集上達到82.23%的準確率
多情感識別
能夠識別8種不同情感:憤怒、平靜、厭惡、恐懼、快樂、中性、悲傷、驚訝
基於Wav2Vec2.0
利用強大的Wav2Vec2.0架構進行特徵提取和分類
優化訓練
採用精心設計的訓練流程和超參數優化

模型能力

語音情感識別
英語語音分析
情感分類

使用案例

人機交互
智能客服情感分析
分析客戶語音中的情感狀態,提升客服服務質量
可識別客戶情緒狀態,幫助客服人員做出更合適的響應
心理健康
情緒狀態監測
通過語音分析監測用戶情緒變化
可用於心理健康應用中的情緒追蹤
娛樂應用
遊戲情感互動
根據玩家語音情緒調整遊戲體驗
創造更個性化的遊戲互動體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase