S

Speech Emotion Recognition With Openai Whisper Large V3

由firdhokk開發
本項目利用Whisper模型實現語音情感識別,能夠將音頻分類為快樂、悲傷、驚訝等不同情感類別。
下載量 7,750
發布時間 : 9/21/2024

模型概述

該模型是基於OpenAI Whisper Large V3微調的語音情感識別模型,能夠準確識別語音中的情感類別。

模型特點

高準確率情感識別
模型在測試集上達到91.99%的準確率,能夠有效識別多種語音情感。
基於Whisper架構
利用Whisper Large V3的強大音頻處理能力進行微調,繼承了其優秀的特徵提取能力。
多數據集訓練
整合RAVDESS、SAVEE、TESS和URDU等多個語音情感數據集進行訓練,提高泛化能力。

模型能力

語音情感識別
音頻分類
多情感類別識別

使用案例

心理健康分析
心理諮詢輔助
通過分析客戶語音情感變化,輔助心理諮詢師評估客戶情緒狀態。
準確識別7種主要情感狀態
客戶服務
客服質量監控
自動分析客服通話中的情感變化,評估服務質量。
可即時監控客服情緒狀態
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase