W

Wav2vec2 Large Xlsr 53 English Finetuned Ravdess

firdho26によって開発
wav2vec2-large-xlsr-53-englishモデルをRAVDESSデータセットでファインチューニングした音声感情認識モデル
ダウンロード数 68
リリース時間 : 1/30/2024

モデル概要

このモデルは英語音声の感情認識タスクに最適化された深層学習モデルで、音声中の感情カテゴリを識別できます。

モデル特徴

高精度感情認識
RAVDESSデータセットで82.99%の精度を達成
事前学習モデルを基にしたファインチューニング
wav2vec2-large-xlsr-53-english事前学習モデルを利用した転移学習
多角的な評価指標
精度、適合率、再現率、F1値など多面的な性能評価を提供

モデル能力

音声感情分類
英語音声分析
オーディオ特徴量抽出

使用事例

感情コンピューティング
音声感情分析
音声録音中の感情状態を分析
複数の感情カテゴリを識別可能
ヒューマンコンピュータインタラクション
インテリジェントカスタマーサポート感情認識
顧客音声中の感情状態を識別
より人間らしい応答を可能にする
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase