W

Wav2vec2 Base Superb Er

superbによって開発
これはWav2Vec2アーキテクチャに基づく音声感情認識モデルで、S3PRLプロジェクトから移植され、音声中の感情カテゴリを識別します。
ダウンロード数 28.14k
リリース時間 : 3/2/2022

モデル概要

このモデルはwav2vec2-baseアーキテクチャに基づき、16kHzでサンプリングされた音声オーディオで事前学習されており、感情認識タスク専用です。

モデル特徴

Wav2Vec2アーキテクチャ採用
効率的なwav2vec2-baseアーキテクチャを採用し、音声処理タスクで優れた性能を発揮
感情分類
音声中の4つの主要な感情カテゴリを識別可能
16kHzサンプリング対応
16kHzでサンプリングされた音声オーディオに最適化

モデル能力

音声感情認識
オーディオ分類

使用事例

感情分析
カスタマーサービス音声分析
カスタマーサービス通話中の顧客感情を分析
喜び、中立などの感情状態を識別可能
心理状態評価
音声分析を通じて話者の心理状態を評価
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase