W

W2v Speech Emotion Recognition

由 Khoa 开发
基于Wav2Vec2架构微调的英语语音情感识别模型,可识别六种情感状态
下载量 147
发布时间 : 8/27/2024

模型简介

该模型专门用于识别英语语音中的情感状态,包括悲伤、愤怒、厌恶、恐惧、快乐和中性。基于Wav2Vec2架构,在Kaggle语音情感识别数据集上进行了微调。

模型特点

多情感识别
能够识别六种不同的情感状态:悲伤、愤怒、厌恶、恐惧、快乐和中性
高准确率
在测试集上达到0.7435的准确率,特别在愤怒和中性情感识别上表现优异
基于Wav2Vec2架构
利用Wav2Vec2的强大特征提取能力,适用于语音情感识别任务

模型能力

英语语音情感识别
六种情感分类
音频特征提取

使用案例

情感分析
客服语音分析
分析客户服务通话中的客户情绪
帮助识别不满客户并提高服务质量
心理健康监测
通过语音分析监测用户情绪状态
辅助心理健康评估和早期干预
人机交互
智能助手情绪响应
使智能助手能够根据用户语音情绪调整响应方式
提升人机交互的自然性和情感共鸣
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase