# 音声感情認識

Whisper Large V3 Msp Podcast Emotion
Whisper-Large V3を基にした音声感情認識モデルで、MSP-Podcastデータセットに最適化されており、9種類の感情分類をサポート
音声分類 Safetensors 英語
W
tiantiaf
282
3
Ast Finetuned Model
Apache-2.0
これはオーディオスペクトログラムトランスフォーマー(AST)ベースのファインチューニングモデルで、音声オーディオの感情分類に特化しています。
音声分類 Transformers 英語
A
forwarder1121
174
0
Wavlm Large Finetuned SER
WavLM-Largeベースの音声感情認識モデルで、英語音声の感情分類をサポートします。
音声分類 英語
W
JBJoyce
139
0
Speech Emotion Recognition With Openai Whisper Large V3
Apache-2.0
本プロジェクトではWhisperモデルを利用して音声感情認識を実現し、音声を喜び、悲しみ、驚きなどの異なる感情カテゴリに分類することができます。
音声分類 Transformers
S
firdhokk
7,750
33
Speechbrain Emotion Recognition Openvino
Apache-2.0
このモデルはファインチューニングされたwav2vec2(ベース)アーキテクチャを使用し、IEMOCAPデータセットでトレーニングされ、音声感情認識タスクに用いられます。
音声分類 英語
S
psakamoori
13
0
SER Odyssey Baseline WavLM Categorical
MIT
WavLMアーキテクチャに基づく音声感情認識のベースラインモデル、8つの基本感情カテゴリを予測
音声分類 Transformers 英語
S
3loi
581
8
Speech Emotion Recognition Wav2vec2 Large Xlsr 53 240304 SER Fine Tuned2.0
Apache-2.0
wav2vec2-large-xlsr-53ベースの音声感情認識モデル、7種類の感情分類に対応
音声分類 Transformers
S
hughlan1214
145
2
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
wav2vec2-large-xlsr-53-englishモデルをRAVDESSデータセットでファインチューニングした音声感情認識モデル
音声分類 Transformers
W
firdho26
68
0
Wav2vec2 Audio Emotion Classification
Apache-2.0
facebook/wav2vec2-baseを微調整した音声感情分類モデルで、音声中の感情状態を分析するために使用されます
音声分類 Transformers
W
dhanush23
15
0
Wav2vec2 Audio Emotion Classification
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声感情分類モデルで、評価セットで73.98%の精度を達成
音声分類 Transformers
W
chin-may
77
5
Wav2vec2 Lg Xlsr En Speech Emotion Recognition Finetuned Ravdess V8
Apache-2.0
wav2vec2アーキテクチャに基づく英語音声感情認識モデル、RAVDESSデータセットで微調整
音声分類 Transformers
W
Wiam
94
4
Emotion Diarization Wavlm Large
Apache-2.0
WavLM Largeモデルをファインチューニングし、音声感情認識と話者ログ分析に使用され、複数の感情分類をサポート
音声分類 英語
E
speechbrain
1,128
52
Distilhubert Finetuned Ravdess
Apache-2.0
DistilHuBERTアーキテクチャを基にRAVDESS音声感情データセットでファインチューニングされた音声感情認識モデル、精度92.36%
音声分類 Transformers
D
pollner
43
2
Finetuned Wav2vec2.0 Base On IEMOCAP 2
Apache-2.0
これはfacebook/wav2vec2-baseモデルをIEMOCAPデータセットでファインチューニングした音声感情認識モデルで、評価セットで73.9%の精度を達成しました。
音声分類 Transformers
F
minoosh
32
2
CREMA D Model
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声感情認識モデルで、評価データセットで73.22%の精度を達成
音声分類 Transformers
C
jdmartinev
21
0
Wav2vec2 Base Toronto Emotional Speech Set
Apache-2.0
wav2vec2-baseを微調整した音声感情分類モデルで、話者の感情状態を識別するために使用されます。
音声分類 Transformers 英語
W
DunnBC22
185
3
Astie Finetuned On Shemo
Bsd-3-clause
このモデルはshEMOデータセットでASTモデルをファインチューニングしたバージョンで、主に音声感情認識タスクに使用されます。
音声分類 Transformers
A
minoosh
24
0
Iewav2vec2 Finetuned On Shemo
Apache-2.0
このモデルはminoosh/wav2vec2-base-finetuned-ieをshEMOデータセットでファインチューニングしたバージョンで、主に音声感情認識タスクに使用されます。
音声分類 Transformers
I
minoosh
20
0
Ser Model Adjusted 2023 03 03
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声感情認識モデルで、評価セットで75.73%の精度を達成
音声分類 Transformers
S
aherzberg
18
0
Ser Model Fixed Label
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声感情認識モデルで、評価データセットで83.67%の精度を達成
音声分類 Transformers
S
aherzberg
18
1
Ser Model
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声感情認識モデルで、評価データセットで84.71%の精度を達成
音声分類 Transformers
S
aherzberg
30
0
Wav2vec2 Base Finetuned Sentiment Mesd
Apache-2.0
facebook/wav2vec2-baseをMESDデータセットでファインチューニングしたスペイン語オーディオ感情分類モデル
音声分類 Transformers
W
somosnlp-hackathon-2022
28
5
Xlsr Wav2vec Speech Emotion Recognition
Apache-2.0
XLSR-Wav2Vecアーキテクチャに基づく音声感情認識モデルで、怒り、嫌悪、恐怖、喜び、悲しみの5つの基本的な感情を認識できます。
音声分類 Transformers 英語
X
harshit345
498
62
Wav2vec2 Base Superb Er
Apache-2.0
これはWav2Vec2アーキテクチャに基づく音声感情認識モデルで、S3PRLプロジェクトから移植され、音声中の感情カテゴリを識別します。
音声分類 Transformers 英語
W
superb
28.14k
11
Wav2vec2 Lg Xlsr En Speech Emotion Recognition
Apache-2.0
Wav2Vec 2.0をファインチューニングした音声感情認識モデルで、8種類の英語感情を識別可能、RAVDESSデータセットで82.23%の精度を達成
音声分類 Transformers
W
ehcalabres
39.83k
221
Wav2vec2 Large Superb Er
Apache-2.0
これはWav2Vec2-Largeモデルに基づく感情認識モデルで、音声から感情カテゴリーを識別するために特別に設計されています。
音声分類 Transformers 英語
W
superb
1,442
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase