W

Wav2vec2 Lg Xlsr En Speech Emotion Recognition

ehcalabresによって開発
Wav2Vec 2.0をファインチューニングした音声感情認識モデルで、8種類の英語感情を識別可能、RAVDESSデータセットで82.23%の精度を達成
ダウンロード数 39.83k
リリース時間 : 3/2/2022

モデル概要

このモデルはjonatasgrosman/wav2vec2-large-xlsr-53-englishをファインチューニングした音声感情認識(SER)モデルで、英語音声の8種類の異なる感情を識別するために特別に設計されています。

モデル特徴

高精度
RAVDESSデータセットで82.23%の精度を達成
多感情認識
怒り、平静、嫌悪、恐怖、幸福、中立、悲しみ、驚きの8種類の感情を識別可能
Wav2Vec2.0ベース
強力なWav2Vec2.0アーキテクチャを特徴抽出と分類に利用
最適化されたトレーニング
入念に設計されたトレーニングプロセスとハイパーパラメータ最適化を採用

モデル能力

音声感情認識
英語音声分析
感情分類

使用事例

人間とコンピュータの相互作用
インテリジェントカスタマーサポート感情分析
顧客の音声から感情状態を分析し、カスタマーサービスの品質向上
顧客の感情状態を識別し、サポート担当者がより適切な対応を行うのを支援
メンタルヘルス
感情状態モニタリング
音声分析を通じてユーザーの感情変化を監視
メンタルヘルスアプリケーションでの感情追跡に利用可能
エンターテインメントアプリケーション
ゲーム感情インタラクション
プレイヤーの音声感情に基づいてゲーム体験を調整
よりパーソナライズされたゲームインタラクション体験を創造
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase