E

Emotion Recognition Wav2vec2 IEMOCAP

speechbrainによって開発
ファインチューニングされたwav2vec2モデルを使用した音声感情認識で、IEMOCAPデータセットでトレーニング
ダウンロード数 237.65k
リリース時間 : 3/2/2022

モデル概要

このモデルは音声信号を分析して話者の感情状態を認識し、wav2vec2アーキテクチャに畳み込みと残差ブロックを組み合わせ、アテンション統計プーリングで特徴を抽出

モデル特徴

効率的な特徴抽出
wav2vec2事前学習モデルを利用して音声特徴を抽出し、アテンション統計プーリングで感情関連特徴を強化
多感情分類
複数の感情状態を認識可能で、IEMOCAPデータセットで78.7%の精度を達成
エンドツーエンド処理
生の音声入力から直接感情分類をサポートし、音声標準化を自動処理

モデル能力

音声感情認識
音声特徴抽出
感情状態分類

使用事例

人間とコンピュータの相互作用
インテリジェントカスタマーサポート感情分析
顧客の音声から感情状態を分析し、サービス応答を最適化
怒り、喜びなどの基本感情状態を識別可能
メンタルヘルス
感情状態モニタリング
日常音声を通じてユーザーの感情変化を分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase