# WavLM架構

SER Odyssey Baseline WavLM Valence
MIT
基於WavLM架構的語音情緒識別模型,專門用於預測語音中的效價(valence)值,範圍為0到1。
音頻分類 Transformers 英語
S
3loi
71
1
SER Odyssey Baseline WavLM Arousal
MIT
基於WavLM架構的語音情緒識別基線模型,專門用於預測語音中的喚醒度值(0-1範圍)
音頻分類 Transformers 英語
S
3loi
72
2
SER Odyssey Baseline WavLM Dominance
MIT
基於WavLM架構的語音情緒識別模型,專用於預測語音中的支配度情緒特徵
音頻分類 Transformers 英語
S
3loi
15
1
SER Odyssey Baseline WavLM Categorical
MIT
基於WavLM架構的語音情緒識別基線模型,用於預測8種基本情緒類別
音頻分類 Transformers 英語
S
3loi
581
8
Audio Cls Wavlm Libri Clean 100h Base Plus Minds14 Finetune
該模型是基於WavLM預訓練模型在Minds14數據集上進行微調的語音分類模型,主要用於語音意圖識別任務。
音頻分類 Transformers
A
jonastokoliu
22
0
Wavlm Basic S F O 8batch 10sec 0.0001lr Unfrozen
基於microsoft/wavlm-large微調的語音處理模型,在評估集上達到80%準確率和79.57% F1分數
音頻分類 Transformers
W
reralle
14
0
Wavlm Libri Clean 100h Base
基於microsoft/wavlm-base在LIBRISPEECH_ASR - CLEAN數據集上微調的自動語音識別模型
語音識別 Transformers
W
patrickvonplaten
6,515
1
Wavlm Large CORAA Pt Cv7
Apache-2.0
基於WavLM-large架構的葡萄牙語自動語音識別模型,在common_voice 7.0數據集上微調
語音識別 Transformers 其他
W
lgris
15
0
Wavlm Libri Clean 100h Large
基於microsoft/wavlm-large在LIBRISPEECH_ASR - CLEAN數據集上微調的自動語音識別模型
語音識別 Transformers
W
patrickvonplaten
8,171
3
Wavlm Base Libri Clean 100
基於WavLM架構的自動語音識別模型,在LibriSpeech CLEAN數據集(100小時)上微調
語音識別 Transformers
W
anjulRajendraSharma
73
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase