W

Wav2vec2 Large Xlsr 53 Th Speech Emotion Recognition 3c

由 Paranchai 开发
基于airesearch/wav2vec2-large-xlsr-53-th微调的泰语语音情感识别模型,支持愤怒、快乐、平静三种情感分类
下载量 9
发布时间 : 10/14/2024

模型简介

该模型是针对泰语语音的情感识别模型,能够从语音中识别愤怒、快乐和平静三种情感状态。

模型特点

高准确率
在评估集上达到84.92%的准确率
泰语优化
基于泰语优化的wav2vec2-large-xlsr-53模型微调
轻量级训练
仅需20轮训练即可达到良好效果

模型能力

泰语语音分析
情感状态识别
语音特征提取

使用案例

情感分析
客服语音分析
分析客户通话中的情感状态
可识别客户愤怒情绪,及时预警
心理健康监测
通过语音分析用户情绪变化
可辅助心理健康状态评估
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase