S

Speechbrain Emotion Recognition Openvino

psakamooriによって開発
このモデルはファインチューニングされたwav2vec2(ベース)アーキテクチャを使用し、IEMOCAPデータセットでトレーニングされ、音声感情認識タスクに用いられます。
ダウンロード数 13
リリース時間 : 6/11/2024

モデル概要

これはwav2vec2ベースの音声感情認識モデルで、畳み込みと残差ブロックを組み合わせ、注意統計プーリングにより埋め込み特徴を抽出し、加算的マージンSoftmax損失でトレーニングされています。

モデル特徴

効率的な感情認識
wav2vec2事前トレーニングモデルをファインチューニングし、効率的で正確な感情認識を実現
注意統計プーリング
注意統計プーリング手法を採用し、より効果的な音声感情特徴を抽出
OpenVINOサポート
OpenVINOによる推論加速をサポートし、様々なIntelハードウェアで動作可能

モデル能力

音声感情分類
リアルタイム感情認識
多感情状態検出

使用事例

人間とコンピュータの相互作用
インテリジェントカスタマーサポート感情分析
顧客の音声から感情状態を分析し、サービス品質を向上
怒り、喜びなどの基本的な感情状態を識別可能
メンタルヘルス
感情状態モニタリング
音声分析によりユーザーの感情変化を把握
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase