audio-emotion-detectionオープンソースオーディオ感情検出モデル

ホーム

Audio Emotion Detection

Hatmanによって開発

このモデルはfacebook/wav2vec2-large-xlsr-53をファインチューニングした音声感情検出モデルで、7種類の感情状態を識別可能

音声分類

Transformers

オープンソースライセンス:Apache-2.0 #多感情認識 #音声感情分析 #wav2vec2ファインチューニング

ダウンロード数 630

リリース時間 : 7/25/2024

モデル概要

このモデルは音声感情認識に使用され、怒り、嫌悪、恐怖、幸福、中立、悲しみ、驚きなどの感情ラベルを出力可能

モデル特徴

高精度感情認識

評価データセットで62.62%の精度を達成、7種類の異なる感情状態を識別可能

強力なベースモデル採用

facebook/wav2vec2-large-xlsr-53をファインチューニングしており、優れた音声特徴抽出能力を継承

標準化された音声処理

すべての訓練音声のサンプリングレートは16000Hzで統一され、処理の一貫性を確保

モデル能力

音声感情分類

音声特徴抽出

多感情状態認識

使用事例

感情分析

コールセンター音声分析

顧客通話中の感情状態を分析し、サービス品質を評価

顧客の怒り、不満などのネガティブ感情を識別可能

心理状態評価

音声分析を通じて話者の心理状態を評価

うつ病、不安などの感情特徴を検出可能

人間と機械のインタラクション

スマートアシスタント感情応答

ユーザーの音声感情に基づいて応答方法を調整

インタラクションの自然さとユーザー体験を向上

学習損失	エポック	ステップ	検証損失	正解率
1.5875	1.0	40	1.2574	0.5133
1.1637	2.0	80	1.0852	0.5590
0.9827	3.0	120	1.0048	0.6090
0.8683	4.0	160	0.9555	0.6262

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Audio Emotion Detection

モデル概要

モデル特徴

モデル能力

使用事例

🚀 音声感情検出

✨ 主な機能

📦 インストール

📚 ドキュメント

学習と評価データ

学習ハイパーパラメータ

学習結果

📄 ライセンス