W

Wav2vec2 Base Toronto Emotional Speech Set

由DunnBC22開發
基於wav2vec2-base微調的音頻情感分類模型,用於識別說話者的情緒狀態。
下載量 185
發布時間 : 5/2/2023

模型概述

該模型是基於facebook/wav2vec2-base在Toronto Emotional Speech Set (TESS)數據集上微調的版本,專門用於對音頻樣本中說話者的情緒進行分類。

模型特點

高準確率情感識別
在評估集上達到88.04%的準確率,能有效識別多種情緒狀態。
基於wav2vec2架構
利用強大的wav2vec2-base模型作為基礎,具有良好的音頻特徵提取能力。
全面評估指標
提供多種評估指標包括F1分數、召回率和精確率,全面反映模型性能。

模型能力

語音情感識別
音頻分類
英語語音分析

使用案例

情感分析
客服對話情緒監測
用於分析客服對話中客戶的即時情緒狀態
可幫助客服人員及時調整溝通策略
心理狀態評估
輔助心理醫生分析患者的語音情緒特徵
提供客觀的情緒狀態參考指標
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase