S

Speech Emotion Recognition With Openai Whisper Large V3

firdhokkによって開発
本プロジェクトではWhisperモデルを利用して音声感情認識を実現し、音声を喜び、悲しみ、驚きなどの異なる感情カテゴリに分類することができます。
ダウンロード数 7,750
リリース時間 : 9/21/2024

モデル概要

このモデルはOpenAI Whisper Large V3を微調整した音声感情認識モデルで、音声の感情カテゴリを正確に識別することができます。

モデル特徴

高い正解率の感情認識
モデルはテストセットで91.99%の正解率を達成し、多様な音声感情を効果的に識別することができます。
Whisperアーキテクチャベース
Whisper Large V3の強力な音声処理能力を利用して微調整を行い、その優れた特徴抽出能力を引き継いでいます。
複数のデータセットでの学習
RAVDESS、SAVEE、TESS、URDUなどの複数の音声感情データセットを統合して学習を行い、汎化能力を向上させます。

モデル能力

音声感情認識
音声分類
複数の感情カテゴリ識別

使用事例

メンタルヘルス分析
心理カウンセリング支援
クライアントの音声感情の変化を分析することで、心理カウンセラーがクライアントの情動状態を評価するのを支援します。
7種類の主要な感情状態を正確に識別
顧客サービス
カスタマーサービスの品質監視
カスタマーサービスの通話中の感情の変化を自動分析し、サービス品質を評価します。
カスタマーサービス担当者の情動状態をリアルタイムで監視可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase