S

Ser Model Fixed Label

aherzbergによって開発
facebook/wav2vec2-baseをファインチューニングした音声感情認識モデルで、評価データセットで83.67%の精度を達成
ダウンロード数 18
リリース時間 : 2/28/2023

モデル概要

このモデルはwav2vec2アーキテクチャに基づく音声感情認識モデルで、音声から感情カテゴリを識別します

モデル特徴

高精度
評価データセットで83.67%の精度を達成
wav2vec2アーキテクチャ採用
facebookのwav2vec2-baseをベースモデルとして使用
エンドツーエンド学習
複雑な特徴量エンジニアリングなしで生の音声入力を直接処理

モデル能力

音声感情認識
音声分類

使用事例

感情分析
コールセンター音声分析
コールセンター通話における顧客の感情状態を分析
83.67%の感情カテゴリを識別可能
メンタルヘルス評価
音声を通じてユーザーの情緒状態を分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase