# 16kHz採樣

Whisper Small Cv11 French
Apache-2.0
基於openai/whisper-small微調的法語自動語音識別模型,訓練數據為Common Voice 11.0法語數據集,支持大小寫和標點符號預測。
語音識別 Transformers 法語
W
bofenghuang
266
4
Whisper Small Cv11 German
Apache-2.0
基於openai/whisper-small在Common Voice 11.0德語數據集上微調的語音識別模型,支持德語語音轉文字並預測大小寫和標點符號。
語音識別 Transformers 德語
W
bofenghuang
67
7
Sepformer Wham16k Enhancement
Apache-2.0
這是一個使用SepFormer架構的語音增強模型,專門用於去除音頻中的噪聲和混響,在WHAM!數據集上以16kHz採樣頻率訓練。
音頻增強 英語
S
speechbrain
5,140
28
Viwav2vec2 Base 1.5k
該模型通過1.5千小時越南語語音數據預訓練得到,適用於越南語語音識別任務,需微調後使用。
語音識別 Transformers 其他
V
dragonSwing
38
0
Wav2vec2 Large Pitch Recognition
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在日語口音數據集上微調的語音識別模型
語音識別 Transformers 日語
W
vumichien
15
2
Hubert Large Ls960 Ft
Apache-2.0
HuBERT-Large是基於LibriSpeech 960小時語音數據微調的自監督語音表示學習模型,用於自動語音識別任務。
語音識別 Transformers 英語
H
facebook
776.27k
66
Wav2vec2 Large Xlsr 53 French
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在Common Voice法語數據集上微調的自動語音識別模型,測試WER為34.86%。
語音識別 法語
W
MehdiHosseiniMoghadam
21
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase