C

CREMA D Model

jdmartinevによって開発
facebook/wav2vec2-baseをファインチューニングした音声感情認識モデルで、評価データセットで73.22%の精度を達成
ダウンロード数 21
リリース時間 : 5/3/2023

モデル概要

このモデルはwav2vec2アーキテクチャに基づく音声感情認識モデルで、音声から感情カテゴリを識別可能

モデル特徴

高精度
評価データセットで73.22%の精度を達成し、ランダム推測を上回る性能
wav2vec2アーキテクチャ採用
実績のあるwav2vec2-baseをベースモデルとして使用し、強力な音声特徴抽出能力を有する
エンドツーエンド学習
モデルは生の音声波形から直接学習し、感情カテゴリを予測可能

モデル能力

音声感情認識
音声特徴抽出
感情分類

使用事例

人間とコンピュータの相互作用
インテリジェントカスタマーサポート感情分析
顧客の音声から感情状態を分析し、より人間らしい対応が可能なカスタマーサポートシステムを実現
メンタルヘルス
感情状態モニタリング
音声分析を通じてユーザーの感情変化を追跡し、メンタルヘルスアプリケーションに活用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase