S

SER Odyssey Baseline WavLM Valence

3loiによって開発
WavLMアーキテクチャに基づく音声感情認識モデルで、音声中の感情価値(valence)を0から1の範囲で予測するために特別に設計されています。
ダウンロード数 71
リリース時間 : 3/15/2024

モデル概要

このモデルはOdyssey 2024感情認識コンペティション向けに開発されたベースラインモデルで、シングルタスクの感情価値予測に特化しており、MSP-Podcastデータセットでトレーニングされています。

モデル特徴

高精度な感情価値予測
音声中の感情価値(valence)予測に特化しており、出力範囲は0から1です。
MSP-Podcastデータセットベース
音声感情認識研究専用のMSP-Podcastデータセットを使用してトレーニングされています。
コンペティションベースラインモデル
Odyssey 2024感情認識コンペティションのベースラインモデルとして、信頼性の高い性能基準を持っています。

モデル能力

音声感情認識
感情価値予測
オーディオ分類

使用事例

音声感情分析
音声感情分析
音声中の感情価値を分析し、感情コンピューティングやヒューマンコンピュータインタラクションに活用します。
OdysseyコンペティションのTest3と開発セットでのCCC指標はそれぞれ0.607と0.709でした。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase