S

Speech Emotion Recognition With Facebook Wav2vec2 Large Xlsr 53

firdhokkによって開発
Wav2Vec2 Large XLSR-53モデルをファインチューニングした音声感情認識システムで、7つの一般的な感情を認識可能
ダウンロード数 66
リリース時間 : 9/20/2024

モデル概要

このモデルはWav2Vec2 Large XLSR-53のファインチューニングにより音声感情分類を実現し、怒り、嫌悪、恐怖、幸福、中立、悲しみ、驚きの7つの感情認識をサポート

モデル特徴

高精度感情認識
テストセットで91.68%の精度と91.66%のF1値を達成
複数データセットでの学習
RAVDESS、SAVEE、TESS、URDUの複数データセットを統合して学習
効率的な特徴抽出
Wav2Vec2特徴抽出器を使用してオーディオデータを処理し、標準化された特徴入力を実現

モデル能力

音声感情認識
オーディオ分類
多感情分類

使用事例

人間とコンピュータの相互作用
インテリジェントカスタマーサポート感情分析
顧客の音声から感情状態を分析
カスタマーサポートの応答品質とユーザー体験を向上
メンタルヘルス
感情状態モニタリング
音声分析を通じてユーザーの感情変化を把握
メンタルヘルス評価を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase