wav2vec2-xlsr英語語音情緒識別開源模型 - 從音頻精準識別六種基本情緒

首頁

Wav2vec2 Xlsr English Speech Emotion Recognition

由AreejB開發

該模型用於從英語音頻中識別六種基本情緒：憤怒、厭惡、恐懼、快樂、悲傷和驚訝，基於RAVDESS數據集訓練。

音頻分類

Transformers

英語#語音情感分析 #英語情感識別 #Wav2Vec2微調

下載量 82

發布時間 : 5/10/2024

模型概述

採用Wav2Vec2架構的英語語音情感識別模型，能夠從音頻錄音中提取情感特徵並進行分類。

模型特點

多情感識別

能夠識別六種基本情緒：憤怒、厭惡、恐懼、快樂、悲傷和驚訝

基於Wav2Vec2架構

利用預訓練的Wav2Vec2模型進行微調，具有良好的語音特徵提取能力

高準確率

在測試集上平均準確率達到84.84%，部分情感識別精確率超過90%

模型能力

英語語音情感識別

音頻特徵提取

多分類情感分析

使用案例

人機交互

智能客服情緒分析

分析客戶語音中的情緒狀態，提升服務質量

可識別憤怒、快樂等關鍵情緒，幫助客服及時調整策略

心理健康

情緒狀態監測

通過語音分析用戶情緒變化

可識別悲傷、恐懼等負面情緒，輔助心理評估

情感	準確率	精確率	召回率	F1分數
憤怒		96.55	87.50
厭惡		90.91	93.75
恐懼		96.30	81.25
快樂		93.10	84.38
悲傷		81.58	96.88
驚訝		77.78	87.50
總計	88.54	89.37	88.54	88.62

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Wav2vec2 Xlsr English Speech Emotion Recognition

模型概述

模型特點

模型能力

使用案例

🚀 英文情感識別模型：基於RAVDESS和Wav2Vec 2.0

🚀 快速開始

✨ 主要特性

📚 詳細文檔

🔍 模型詳情

模型描述

📊 訓練詳情

訓練數據

訓練過程

📈 評估

🧪 測試

📋 結果