# 語音情感識別

Wavlm Base Emotion
MIT
基於WavLM-Base微調的語音情感識別模型,能夠將音頻分類為7種不同情感
音頻分類 Transformers 英語
W
jihedjabnoun
111
1
Whisper Large V3 Msp Podcast Emotion
基於Whisper-Large V3的語音情感識別模型,專為MSP-Podcast數據集優化,支持9種情感分類
音頻分類 Safetensors 英語
W
tiantiaf
282
3
Ast Finetuned Model
Apache-2.0
這是一個基於音頻頻譜圖變壓器(AST)的微調模型,專門用於語音音頻中的情感分類。
音頻分類 Transformers 英語
A
forwarder1121
174
0
Wavlm Large Finetuned SER
基於WavLM-Large的語音情感識別模型,支持英文語音情感分類。
音頻分類 英語
W
JBJoyce
139
0
Speech Emotion Recognition With Openai Whisper Large V3
Apache-2.0
本項目利用Whisper模型實現語音情感識別,能夠將音頻分類為快樂、悲傷、驚訝等不同情感類別。
音頻分類 Transformers
S
firdhokk
7,750
33
Speechbrain Emotion Recognition Openvino
Apache-2.0
該模型使用微調的wav2vec2(基礎)架構,在IEMOCAP數據集上訓練,用於語音情感識別任務。
音頻分類 英語
S
psakamoori
13
0
Speech Emotion Recognition Wav2vec2 Large Xlsr 53 240304 SER Fine Tuned2.0
Apache-2.0
基於wav2vec2-large-xlsr-53的語音情感識別模型,支持7種情感分類
音頻分類 Transformers
S
hughlan1214
145
2
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
基於wav2vec2-large-xlsr-53-english模型在RAVDESS數據集上微調的語音情感識別模型
音頻分類 Transformers
W
firdho26
68
0
Wav2vec2 Audio Emotion Classification
Apache-2.0
基於facebook/wav2vec2-base微調的音頻情感分類模型,用於分析語音中的情感狀態
音頻分類 Transformers
W
dhanush23
15
0
Wav2vec2 Audio Emotion Classification
Apache-2.0
基於facebook/wav2vec2-base微調的音頻情感分類模型,在評估集上準確率達73.98%
音頻分類 Transformers
W
chin-may
77
5
Wav2vec2 Lg Xlsr En Speech Emotion Recognition Finetuned Ravdess V8
Apache-2.0
基於wav2vec2架構的英語語音情感識別模型,在RAVDESS數據集上微調
音頻分類 Transformers
W
Wiam
94
4
Emotion Diarization Wavlm Large
Apache-2.0
使用WavLM Large模型進行微調,用於語音情感識別和說話人日誌分析,支持多種情感分類
音頻分類 英語
E
speechbrain
1,128
52
Distilhubert Finetuned Ravdess
Apache-2.0
基於DistilHuBERT架構在RAVDESS語音情感數據集上微調的語音情感識別模型,準確率達92.36%
音頻分類 Transformers
D
pollner
43
2
Finetuned Wav2vec2.0 Base On IEMOCAP 2
Apache-2.0
這是一個基於facebook/wav2vec2-base模型在IEMOCAP數據集上微調的語音情感識別模型,在評估集上取得了73.9%的準確率。
音頻分類 Transformers
F
minoosh
32
2
CREMA D Model
Apache-2.0
基於facebook/wav2vec2-base微調的語音情感識別模型,在評估集上達到73.22%的準確率
音頻分類 Transformers
C
jdmartinev
21
0
Astie Finetuned On Shemo
Bsd-3-clause
本模型是在shEMO數據集上對AST模型進行微調的版本,主要用於語音情感識別任務。
音頻分類 Transformers
A
minoosh
24
0
Iewav2vec2 Finetuned On Shemo
Apache-2.0
該模型是基於minoosh/wav2vec2-base-finetuned-ie在shEMO數據集上微調的版本,主要用於語音情感識別任務。
音頻分類 Transformers
I
minoosh
20
0
Ser Model Adjusted 2023 03 03
Apache-2.0
基於facebook/wav2vec2-base微調的語音情感識別模型,在評估集上準確率達到75.73%
音頻分類 Transformers
S
aherzberg
18
0
Ser Model Fixed Label
Apache-2.0
基於facebook/wav2vec2-base微調的語音情感識別模型,在評估集上準確率達到83.67%
音頻分類 Transformers
S
aherzberg
18
1
Ser Model
Apache-2.0
基於facebook/wav2vec2-base微調的語音情感識別模型,在評估集上準確率達到84.71%
音頻分類 Transformers
S
aherzberg
30
0
Wav2vec2 Base Finetuned Sentiment Mesd
Apache-2.0
基於facebook/wav2vec2-base在MESD數據集上微調的西班牙語音頻情感分類模型
音頻分類 Transformers
W
somosnlp-hackathon-2022
28
5
Wav2vec2 Large Superb Er
Apache-2.0
這是一個基於Wav2Vec2-Large模型的情感識別模型,專門用於從語音中識別情感類別。
音頻分類 Transformers 英語
W
superb
1,442
1
Hubert Large Superb Er
Apache-2.0
基於Hubert-Large預訓練模型的情感識別模型,用於預測語音中的情感類別
音頻分類 Transformers 英語
H
superb
10.24k
21
Wav2vec2 Base Superb Er
Apache-2.0
這是一個基於Wav2Vec2架構的語音情感識別模型,移植自S3PRL項目,用於識別語音中的情感類別。
音頻分類 Transformers 英語
W
superb
28.14k
11
Wav2vec2 Lg Xlsr En Speech Emotion Recognition
Apache-2.0
基於Wav2Vec 2.0微調的語音情感識別模型,支持識別8種英語情感,在RAVDESS數據集上準確率達82.23%
音頻分類 Transformers
W
ehcalabres
39.83k
221
Xlsr Wav2vec Speech Emotion Recognition
Apache-2.0
基於XLSR-Wav2Vec架構的語音情感識別模型,能夠識別五種基本情感:憤怒、厭惡、恐懼、快樂和悲傷。
音頻分類 Transformers 英語
X
harshit345
498
62
Hubert Base Superb Er
Apache-2.0
該模型是基於Hubert-Base架構的情感識別模型,在SUPERB情感識別任務上訓練,用於語音情感分類
音頻分類 Transformers 英語
H
superb
7,887
20
Hubert Emotion
基於Hubert架構的語音情感識別模型,能夠從音頻中識別說話者的情感狀態。
音頻分類 Transformers
H
Rajaram1996
76
32
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase