W

Wav2vec2 Xls R 300m Pt Br Spontaneous Speech Emotion Recognition

由alefiury開發
基於Wav2vec 2.0 XLS-R架構的語音情感識別模型,在葡萄牙語自發語音情感識別任務中表現優異
下載量 16
發布時間 : 3/23/2022

模型概述

該模型專門用於識別自發語音中的情感狀態,支持多種語言的情感分析,在SE&R 2022比賽中獲得情感識別賽道第一名

模型特點

多語言情感識別
支持葡萄牙語、意大利語、英語和阿拉伯語的情感狀態識別
自發語音優化
專門針對自發語音場景優化,能有效處理非標準發音和自然對話中的情感表達
高性能表現
在測試集上達到81.87%的宏平均F1分數,準確率達90.90%

模型能力

語音情感分類
多語言語音處理
自發語音分析

使用案例

情感分析
客服對話情感監測
即時分析客戶服務通話中的客戶情感狀態
可識別中性、積極和消極情緒,幫助改進服務質量
心理狀態評估
通過語音分析評估說話者的心理狀態
可輔助心理諮詢師進行初步情緒狀態判斷
語音交互
智能語音助手
使語音助手能根據用戶情緒調整響應方式
提升人機交互的自然度和用戶體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase