W

Wav2vec2 Ser English Finetuned

由dihuzz開發
該模型基於Wav2Vec2架構微調訓練,專門用於識別英語語音中的六種情緒狀態(悲傷、憤怒、厭惡、恐懼、快樂、中性),準確率達92.42%。
下載量 68
發布時間 : 4/11/2025

模型概述

一個經過微調的Wav2Vec2模型,用於英語語音情緒識別任務,能夠準確分類六種基本情緒。

模型特點

高準確率
在測試集上達到92.42%的準確率,損失值僅為0.219
多情緒識別
可識別六種基本情緒:悲傷、憤怒、厭惡、恐懼、快樂和中性
基於Wav2Vec2架構
利用Wav2Vec2的強大特徵提取能力進行語音情緒分類
輕量級推理
適合即時應用場景,可在普通GPU上高效運行

模型能力

英語語音情緒分類
即時情緒分析
語音情感識別

使用案例

心理健康
心理狀態監測
通過語音分析用戶情緒狀態,用於心理健康應用
可自動識別用戶情緒變化
客戶服務
客服質量評估
分析客服通話中的情緒狀態
幫助提升服務質量
人機交互
情感化語音助手
使語音助手能夠理解用戶情緒並做出相應回應
提升用戶體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase