X

Xlsr Wav2vec Speech Emotion Recognition

harshit345によって開発
XLSR-Wav2Vecアーキテクチャに基づく音声感情認識モデルで、怒り、嫌悪、恐怖、喜び、悲しみの5つの基本的な感情を認識できます。
ダウンロード数 498
リリース時間 : 3/2/2022

モデル概要

このモデルはWav2Vec2アーキテクチャを使用して音声感情分類を行い、音声信号から話者の感情状態を認識するのに適しています。

モデル特徴

多感情認識
怒り、嫌悪、恐怖、喜び、悲しみの5つの基本的な感情を認識できます。
Wav2Vec2アーキテクチャに基づく
Wav2Vec2の自己教師付き学習能力を利用し、音声感情認識タスクで良好な性能を発揮します。
高い正解率
テストデータでの全体的な正解率は80.6%で、各感情の認識性能がバランスよくなっています。

モデル能力

音声感情分類
音声信号処理
感情確率スコアリング

使用事例

ヒューマン・マシンインタラクション
カスタマーサービスシステムの感情分析
顧客の音声の感情状態を分析し、カスタマーサービスシステムがより賢い応答をするのを支援します。
顧客の怒りや不満などのネガティブな感情を正確に認識できます
メンタルヘルス
情動状態のモニタリング
日常の音声を分析してユーザーの情動変化を把握します。
うつ病などの精神疾患の補助診断に利用できます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase