# 魯棒語音處理

Wav2vec2 Large Robust 6 Ft Age Gender Finetuned Gtzan
基於wav2vec2架構的音頻分類模型,在privateSLI數據集上微調,用於年齡和性別識別任務
音頻分類 Transformers
W
languageresearch
15
0
Wav2vec2 Xls R 300m Lm Hebrew
Apache-2.0
基於facebook/wav2vec2-xls-r-300m微調的希伯來語語音識別模型,添加了n-gram語言模型增強
語音識別 Transformers 其他
W
imvladikon
21
1
Wav2vec2 Xls R 1b De Cv8
Apache-2.0
基於facebook/wav2vec2-xls-r-1b在Common Voice 8德語數據集上微調的自動語音識別模型
語音識別 Transformers 德語
W
jsnfly
22
0
Xls R 300m Dv
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在Common Voice 8迪維希語數據集上微調的自動語音識別模型
語音識別 Transformers 其他
X
shahukareem
14
0
Wav2vec2 Large Xls R 300m Romansh Sursilvan
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在羅曼什語蘇塞爾瓦方言數據集上微調的自動語音識別模型
語音識別 Transformers
W
infinitejoy
15
0
Xls R 2B Te
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-2b模型微調的泰盧固語自動語音識別(ASR)模型,在OpenSLR SLR66數據集上訓練
語音識別 Transformers 其他
X
chmanoj
20
0
Xls R 300 Sv Cv7
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m在瑞典語Common Voice 7.0數據集上微調的自動語音識別模型
語音識別 Transformers 其他
X
patrickvonplaten
19
0
Wav2vec2 Xls R 300m Italian Robust
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在多個意大利語語音數據集上微調的自動語音識別模型
語音識別 Transformers 其他
W
dbdmg
28
0
Wav2vec2 Xls R Pt Cv7 From Bp400h
Apache-2.0
這是一個基於wav2vec2 XLS-R架構的葡萄牙語自動語音識別(ASR)模型,在Common Voice 7數據集上微調,在測試集上取得12.13%的詞錯誤率(WER)。
語音識別 Transformers 其他
W
lgris
94
0
Wav2vec2 Indonesian Javanese Sundanese
Apache-2.0
這是一個支持印尼語、爪哇語和巽他語的多語種語音識別模型,基於facebook/wav2vec2-large-xlsr-53微調而成。
語音識別 Transformers 其他
W
indonesian-nlp
298
6
Wav2vec2 Large Xls R 1b Indonesian
Apache-2.0
基於facebook/wav2vec2-xls-r-1b在Common Voice印尼語數據集上微調的自動語音識別模型
語音識別 Transformers 其他
W
kingabzpro
14
1
Wav2vec2 Xls R 1b Japanese
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-1b在公共日語語音數據集上進行微調的版本,支持日語自動語音識別任務。
語音識別 Transformers 日語
W
vumichien
50
2
Wav2vec2 Large Xls R 300m Hindi
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在印地語數據集上微調的語音識別模型,支持印地語語音轉文本任務。
語音識別 Transformers 其他
W
ravirajoshi
26
0
Wav2vec2 Base Turkish
Apache-2.0
該模型是基於Common Voice土耳其語數據集微調的Wav2Vec2語音識別模型,在土耳其語自動語音識別任務上表現優異。
語音識別 Transformers 其他
W
cahya
49
4
Wav2vec2 Large Xlsr Coraa Portuguese Cv7
Apache-2.0
基於Edresson/wav2vec2-large-xlsr-coraa-portuguese在common_voice數據集上微調的葡萄牙語語音識別模型
語音識別 Transformers 其他
W
lgris
24
0
Wav2vec2 Xls R 300m Indonesian
Apache-2.0
基於Facebook的XLS-R-300M模型在印度尼西亞語語音數據上微調的自動語音識別模型
語音識別 Transformers 其他
W
Wikidepia
4,486
1
Wav2vec2 Large Xls R 300m Latvian
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m在拉脫維亞語數據集上微調的自動語音識別模型,在Common Voice 7測試集上取得了16.98%的WER。
語音識別 Transformers 其他
W
infinitejoy
222
1
Wav2vec2 Xls R 1b Korean
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-1b在KRESNIK/ZEROTH_KOREAN - CLEAN數據集上微調的韓語自動語音識別模型
語音識別 Transformers 韓語
W
anantoj
20
2
Wav2vec2 Xls R 300m Turkish Tr Small
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在通用語音數據集上微調的土耳其語語音識別模型
語音識別 Transformers
W
emre
19
0
Wav2vec2 Large Xlsr 53 Demo Colab
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在common_voice數據集上微調得到的語音識別模型,主要用於魯棒語音事件識別。
語音識別 Transformers
W
emre
16
0
Wav2vec2 Large Xlsr 53 Demo Colab
Apache-2.0
這是一個基於wav2vec2架構的自動語音識別模型,專門針對泰米爾語進行優化,支持尼泊爾語語音識別任務。
語音識別 Transformers 其他
W
Mahalakshmi
17
0
Wav2vec2 Large Xls R 300m Br D2
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在布列塔尼語(Common Voice 8.0)上微調的語音識別模型
語音識別 Transformers 其他
W
DrishtiSharma
21
0
Galician Xlsr
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在加利西亞語數據集上微調的自動語音識別模型,在Common Voice 8.0測試集上取得了11.31%的WER。
語音識別 Transformers 其他
G
Akashpb13
110
1
Wav2vec2 Xls R 300m German De
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - DE數據集上微調的德語自動語音識別模型。
語音識別 Transformers 德語
W
AndrewMcDowell
72
3
Wav2vec2 Large Xls R 300m Cv8 Nl
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在Common Voice 8荷蘭語數據集上微調的自動語音識別模型,包含6元語法KenLM語言模型
語音識別 Transformers 其他
W
RuudVelo
22
0
Xls R Nl V1 Cv8 Lm
這是一個基於XLS-R架構的自動語音識別模型,專門針對荷蘭語和佛蘭芒語優化,結合了5-gram語言模型以提高識別準確率。
語音識別 Transformers 其他
X
FremyCompany
14
3
Xls R 2b Nl V2 Lm 5gram Os2 Hunspell
基於XLS-R的CTC模型,帶有來自Open Subtitles的5-gram語言模型,主要用於荷蘭語和佛蘭芒語的自動語音識別。
語音識別 Transformers 其他
X
FremyCompany
18
4
Wav2vec2 Large Xls R 300m Hi Cv8
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在印地語Common Voice 8數據集上微調的自動語音識別(ASR)模型。
語音識別 Transformers 其他
W
DrishtiSharma
25
0
Wav2vec2 Large Xls R 300m Sl With LM V1
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在斯洛文尼亞語(Common Voice 8.0)數據集上微調的自動語音識別(ASR)模型,結合語言模型(LM)提升了識別效果。
語音識別 Transformers 其他
W
DrishtiSharma
25
0
Wav2vec2 Large Xls R 300m Sat Final
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - SAT數據集上微調的自動語音識別模型,支持Santali (Ol Chiki)語言。
語音識別 Transformers 其他
W
DrishtiSharma
28
0
Wav2vec2 Large Xls R 300m Hindi Kaggle
基於common_voice數據集訓練的印地語語音識別模型
語音識別 Transformers 其他
W
Saitomar
27
0
Wav2vec2 Large Xls R 1b Cv8 Mt
Apache-2.0
基於facebook/wav2vec2-xls-r-1b在Common Voice 8馬耳他語數據集上微調的自動語音識別模型
語音識別 Transformers 其他
W
RuudVelo
17
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase