E

Emotion Diarization Wavlm Large

speechbrainによって開発
WavLM Largeモデルをファインチューニングし、音声感情認識と話者ログ分析に使用され、複数の感情分類をサポート
ダウンロード数 1,128
リリース時間 : 7/4/2023

モデル概要

このモデルはWavLM Largeアーキテクチャをファインチューニングすることで、音声記録内の感情成分を認識し、その時間境界を特定することができ、感情分析や話者ログタスクに適しています。

モデル特徴

多感情データセット訓練
モデルは5つの主要な感情データセット(Zaion、IEMOCAP、RAVDESSなど)で訓練されており、幅広い感情認識能力を持っています
時間境界検出
感情タイプを認識するだけでなく、感情セグメントの正確な時間境界を特定できます
高精度感情分類
Zaionテストセットで29.7%の感情ログエラー率(EDER)を達成

モデル能力

音声感情認識
話者ログ分析
感情時間境界検出
多感情分類

使用事例

感情分析
カスタマーサービス会話分析
カスタマーサービス会話における顧客の感情変化を分析
怒り、喜びなどのキー感情ポイントを識別
心理状態評価
音声分析を通じて話者の心理状態を評価
うつ病、不安などの感情特徴を検出
メディア分析
映画・テレビ感情分析
映画・テレビ作品におけるキャラクターの感情変化を分析
コンテンツ分析を支援する感情タイムラインを生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase