W

Wav2vec2 Large Xlsr 53 Th Speech Emotion Recognition 3c 10ep

Paranchaiによって開発
airesearch/wav2vec2-large-xlsr-53-thをファインチューニングした音声感情認識モデルで、評価セットで85.79%の精度を達成
ダウンロード数 9
リリース時間 : 10/14/2024

モデル概要

このモデルはタイ語音声感情認識タスク向けにファインチューニングされたwav2vec2モデルで、音声中の感情カテゴリを識別可能

モデル特徴

高精度
評価セットで85.79%の感情認識精度を達成
事前学習モデルベース
強力なairesearch/wav2vec2-large-xlsr-53-thモデルをベースにファインチューニング
最適化トレーニング
10エポックの精密チューニングを実施、線形学習率スケジューリングとウォームアップを採用

モデル能力

タイ語音声感情認識
音声特徴抽出
3分類感情認識

使用事例

感情分析
カスタマーサービス音声感情分析
カスタマーサービス通話中の顧客感情状態を分析
85.79%の感情カテゴリを識別可能
メンタルヘルスモニタリング
音声を通じてユーザーの情緒状態を分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase