W

Wav2vec2 Large Xlsr 53 Th Speech Emotion Recognition 3c

Paranchaiによって開発
airesearch/wav2vec2-large-xlsr-53-thをファインチューニングしたタイ語音声感情認識モデルで、怒り、喜び、平静の3つの感情分類をサポート
ダウンロード数 9
リリース時間 : 10/14/2024

モデル概要

このモデルはタイ語音声の感情認識モデルで、音声から怒り、喜び、平静の3つの感情状態を識別できます。

モデル特徴

高精度
評価データセットで84.92%の精度を達成
タイ語最適化
タイ語に最適化されたwav2vec2-large-xlsr-53モデルをファインチューニング
軽量トレーニング
わずか20エポックのトレーニングで良好な効果を達成

モデル能力

タイ語音声分析
感情状態認識
音声特徴抽出

使用事例

感情分析
カスタマーサービス音声分析
顧客通話中の感情状態を分析
顧客の怒りの感情を識別し、早期警告が可能
メンタルヘルスモニタリング
音声分析によるユーザーの感情変化の追跡
メンタルヘルス状態評価の補助が可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase