W

Wavlm Base Emotion

由jihedjabnoun開發
基於WavLM-Base微調的語音情感識別模型,能夠將音頻分類為7種不同情感
下載量 111
發布時間 : 6/2/2025

模型概述

該模型是基於microsoft/wavlm-base微調的語音情感識別模型,主要用於從語音音頻中識別憤怒、厭惡、恐懼、快樂、中性、悲傷和驚訝等7種情感。

模型特點

多情感分類
能夠識別7種不同的情感狀態
多數據集訓練
在MELD、CREMA-D、TESS、RAVDESS和SAVEE等多個數據集上訓練
說話人多樣性
訓練集包含380個獨特的說話人,提高了模型泛化能力

模型能力

語音情感分類
音頻特徵提取
情感概率分佈輸出

使用案例

人機交互
智能客服情感分析
分析客戶語音中的情感狀態,改善服務質量
可識別客戶滿意度水平
心理健康
情緒狀態監測
通過語音分析用戶的情緒變化
可用於心理健康應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase