A

Ast Finetuned Model

forwarder1121によって開発
これはオーディオスペクトログラムトランスフォーマー(AST)ベースのファインチューニングモデルで、音声オーディオの感情分類に特化しています。
ダウンロード数 174
リリース時間 : 11/17/2024

モデル概要

このモデルはCREMA-Dデータセットでファインチューニングされ、6つの感情カテゴリー(怒り、嫌悪、恐怖、幸福、中立、悲しみ)に焦点を当てており、音声感情認識タスクに適しています。

モデル特徴

オーディオスペクトログラムトランスフォーマーベース
先進的なオーディオスペクトログラムトランスフォーマーアーキテクチャを採用し、音声中の感情特徴を効果的に捉えることができます。
6つの感情分類
怒り、嫌悪、恐怖、幸福、中立、悲しみの6つの感情カテゴリーの識別をサポートします。
データ拡張
トレーニングプロセスではノイズ注入、時間シフト、速度摂動などのデータ拡張技術を使用し、モデルの堅牢性を向上させました。

モデル能力

音声感情認識
オーディオ分類
感情分析

使用事例

人間とコンピュータの相互作用
インテリジェントカスタマーサポートの感情分析
カスタマーサポート通話中のユーザーの感情状態を分析し、サービス品質を向上させるために使用されます。
メンタルヘルス
感情状態モニタリング
音声分析を通じてユーザーの感情変化を監視し、メンタルヘルスアプリケーションに使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase