S

Ser Model

aherzbergによって開発
facebook/wav2vec2-baseをファインチューニングした音声感情認識モデルで、評価データセットで84.71%の精度を達成
ダウンロード数 30
リリース時間 : 2/26/2023

モデル概要

このモデルはwav2vec2アーキテクチャに基づく音声感情認識(SER)モデルで、facebook/wav2vec2-baseをファインチューニングしており、音声から感情状態を識別するために使用されます

モデル特徴

高精度
評価データセットで84.71%の分類精度を達成
wav2vec2アーキテクチャベース
wav2vec2の強力な音声特徴抽出能力を活用
エンドツーエンド学習
生の音声信号から直接感情特徴を学習

モデル能力

音声感情認識
音声特徴抽出
感情分類

使用事例

人間とコンピュータの相互作用
インテリジェントカスタマーサービスの感情分析
顧客の音声から感情状態を分析し、サービス品質を向上
メンタルヘルス
感情状態モニタリング
音声分析によるユーザーの感情変化の追跡
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase