W

Wav2vec2 Large Xlsr 53 Th Speech Emotion Recognition 3c 10ep

由Paranchai開發
基於 airesearch/wav2vec2-large-xlsr-53-th 微調的語音情感識別模型,在評估集上達到85.79%準確率
下載量 9
發布時間 : 10/14/2024

模型概述

該模型是針對泰語語音情感識別任務微調的wav2vec2模型,能夠識別語音中的情感類別

模型特點

高準確率
在評估集上達到85.79%的情感識別準確率
基於預訓練模型
基於強大的airesearch/wav2vec2-large-xlsr-53-th模型微調
優化訓練
經過10個epoch的精細調優,使用線性學習率調度和預熱

模型能力

泰語語音情感識別
語音特徵提取
三分類情感識別

使用案例

情感分析
客服語音情感分析
分析客戶服務通話中的客戶情感狀態
可識別85.79%的情感類別
心理健康監測
通過語音分析用戶情緒狀態
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase