W

Wav2vec2 Base Toronto Emotional Speech Set

DunnBC22によって開発
wav2vec2-baseを微調整した音声感情分類モデルで、話者の感情状態を識別するために使用されます。
ダウンロード数 185
リリース時間 : 5/2/2023

モデル概要

このモデルはfacebook/wav2vec2-baseをToronto Emotional Speech Set (TESS)データセットで微調整したバージョンで、音声サンプル中の話者の感情を分類するために特別に設計されています。

モデル特徴

高精度感情認識
評価セットで88.04%の精度を達成し、様々な感情状態を効果的に識別できます。
wav2vec2アーキテクチャベース
強力なwav2vec2-baseモデルを基盤としており、優れた音声特徴抽出能力を備えています。
包括的な評価指標
F1スコア、再現率、適合率など複数の評価指標を提供し、モデルの性能を包括的に反映します。

モデル能力

音声感情認識
音声分類
英語音声分析

使用事例

感情分析
カスタマーサポート会話の感情モニタリング
カスタマーサポート会話中の顧客のリアルタイム感情状態を分析するために使用されます
サポート担当者がコミュニケーション戦略を適時調整するのに役立ちます
心理状態評価
心理医が患者の音声感情特徴を分析するのを補助します
客観的な感情状態の参考指標を提供します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase