H

Hubert Large Speech Emotion Recognition Russian Dusha Finetuned

xbgooseによって開発
このモデルはHuBERTアーキテクチャを基にファインチューニングされたロシア語音声感情認識モデルで、DUSHAデータセットで訓練されており、中立、怒り、ポジティブ、悲しみなどの感情状態を識別できます。
ダウンロード数 111.13k
リリース時間 : 5/28/2023

モデル概要

これはロシア語音声感情認識専用の深層学習モデルで、facebook/hubert-large-ls960-ft事前学習モデルを基にファインチューニングされており、音声感情分析のアプリケーションシナリオに適しています。

モデル特徴

高精度感情認識
テストセットで86%の精度と81%のF1スコアを達成し、ベースラインを上回る性能
ロシア語向け最適化
ロシア語DUSHAデータセットで専用にファインチューニングされており、ロシア語音声感情分析に適している
効率的なファインチューニング戦略
部分層凍結と半データセット訓練を採用し、性能を維持しながら訓練効率を向上

モデル能力

ロシア語音声感情分類
オーディオ特徴量抽出
感情状態識別

使用事例

感情分析
コールセンター音声感情モニタリング
コールセンター通話中の顧客感情変化を分析
怒りなどのネガティブ感情を識別し、早期警告が可能
メンタルヘルス評価
うつ病患者の感情状態を音声分析
悲しみの感情変化傾向を検出可能
人間とコンピュータの相互作用
インテリジェント音声アシスタント
ユーザーの音声感情に基づき応答戦略を調整
より人間らしいインタラクション体験を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase