W

Wav2vec2 Large Xlsr 53 Th Speech Emotion Recognition 3c

由Paranchai開發
基於airesearch/wav2vec2-large-xlsr-53-th微調的泰語語音情感識別模型,支持憤怒、快樂、平靜三種情感分類
下載量 9
發布時間 : 10/14/2024

模型概述

該模型是針對泰語語音的情感識別模型,能夠從語音中識別憤怒、快樂和平靜三種情感狀態。

模型特點

高準確率
在評估集上達到84.92%的準確率
泰語優化
基於泰語優化的wav2vec2-large-xlsr-53模型微調
輕量級訓練
僅需20輪訓練即可達到良好效果

模型能力

泰語語音分析
情感狀態識別
語音特徵提取

使用案例

情感分析
客服語音分析
分析客戶通話中的情感狀態
可識別客戶憤怒情緒,及時預警
心理健康監測
通過語音分析用戶情緒變化
可輔助心理健康狀態評估
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase