# 鲁棒语音处理

Wav2vec2 Large Robust 6 Ft Age Gender Finetuned Gtzan
基于wav2vec2架构的音频分类模型,在privateSLI数据集上微调,用于年龄和性别识别任务
音频分类 Transformers
W
languageresearch
15
0
Wav2vec2 Xls R 1b De Cv8
Apache-2.0
基于facebook/wav2vec2-xls-r-1b在Common Voice 8德语数据集上微调的自动语音识别模型
语音识别 Transformers 德语
W
jsnfly
22
0
Xls R 300m Dv
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在Common Voice 8迪维希语数据集上微调的自动语音识别模型
语音识别 Transformers 其他
X
shahukareem
14
0
Xls R 300 Sv Cv7
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m在瑞典语Common Voice 7.0数据集上微调的自动语音识别模型
语音识别 Transformers 其他
X
patrickvonplaten
19
0
Wav2vec2 Large Xls R 1b Indonesian
Apache-2.0
基于facebook/wav2vec2-xls-r-1b在Common Voice印尼语数据集上微调的自动语音识别模型
语音识别 Transformers 其他
W
kingabzpro
14
1
Wav2vec2 Large Xls R 300m Hindi
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在印地语数据集上微调的语音识别模型,支持印地语语音转文本任务。
语音识别 Transformers 其他
W
ravirajoshi
26
0
Wav2vec2 Xls R 1b Japanese
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-1b在公共日语语音数据集上进行微调的版本,支持日语自动语音识别任务。
语音识别 Transformers 日语
W
vumichien
50
2
Wav2vec2 Large Xls R 300m Romansh Sursilvan
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在罗曼什语苏塞尔瓦方言数据集上微调的自动语音识别模型
语音识别 Transformers
W
infinitejoy
15
0
Wav2vec2 Base Turkish
Apache-2.0
该模型是基于Common Voice土耳其语数据集微调的Wav2Vec2语音识别模型,在土耳其语自动语音识别任务上表现优异。
语音识别 Transformers 其他
W
cahya
49
4
Wav2vec2 Large Xlsr Coraa Portuguese Cv7
Apache-2.0
基于Edresson/wav2vec2-large-xlsr-coraa-portuguese在common_voice数据集上微调的葡萄牙语语音识别模型
语音识别 Transformers 其他
W
lgris
24
0
Wav2vec2 Xls R 300m Italian Robust
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在多个意大利语语音数据集上微调的自动语音识别模型
语音识别 Transformers 其他
W
dbdmg
28
0
Wav2vec2 Xls R 300m Turkish Tr Small
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在通用语音数据集上微调的土耳其语语音识别模型
语音识别 Transformers
W
emre
19
0
Xls R 2B Te
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-2b模型微调的泰卢固语自动语音识别(ASR)模型,在OpenSLR SLR66数据集上训练
语音识别 Transformers 其他
X
chmanoj
20
0
Wav2vec2 Xls R 1b Korean
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-1b在KRESNIK/ZEROTH_KOREAN - CLEAN数据集上微调的韩语自动语音识别模型
语音识别 Transformers 韩语
W
anantoj
20
2
Wav2vec2 Xls R 300m Indonesian
Apache-2.0
基于Facebook的XLS-R-300M模型在印度尼西亚语语音数据上微调的自动语音识别模型
语音识别 Transformers 其他
W
Wikidepia
4,486
1
Wav2vec2 Xls R Pt Cv7 From Bp400h
Apache-2.0
这是一个基于wav2vec2 XLS-R架构的葡萄牙语自动语音识别(ASR)模型,在Common Voice 7数据集上微调,在测试集上取得12.13%的词错误率(WER)。
语音识别 Transformers 其他
W
lgris
94
0
Wav2vec2 Xls R 300m Lm Hebrew
Apache-2.0
基于facebook/wav2vec2-xls-r-300m微调的希伯来语语音识别模型,添加了n-gram语言模型增强
语音识别 Transformers 其他
W
imvladikon
21
1
Wav2vec2 Indonesian Javanese Sundanese
Apache-2.0
这是一个支持印尼语、爪哇语和巽他语的多语种语音识别模型,基于facebook/wav2vec2-large-xlsr-53微调而成。
语音识别 Transformers 其他
W
indonesian-nlp
298
6
Wav2vec2 Large Xlsr 53 Demo Colab
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在common_voice数据集上微调得到的语音识别模型,主要用于鲁棒语音事件识别。
语音识别 Transformers
W
emre
16
0
Wav2vec2 Large Xls R 300m Latvian
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m在拉脱维亚语数据集上微调的自动语音识别模型,在Common Voice 7测试集上取得了16.98%的WER。
语音识别 Transformers 其他
W
infinitejoy
222
1
Xls R Nl V1 Cv8 Lm
这是一个基于XLS-R架构的自动语音识别模型,专门针对荷兰语和佛兰芒语优化,结合了5-gram语言模型以提高识别准确率。
语音识别 Transformers 其他
X
FremyCompany
14
3
Xls R 2b Nl V2 Lm 5gram Os2 Hunspell
基于XLS-R的CTC模型,带有来自Open Subtitles的5-gram语言模型,主要用于荷兰语和佛兰芒语的自动语音识别。
语音识别 Transformers 其他
X
FremyCompany
18
4
Wav2vec2 Large Xls R 1b Cv8 Mt
Apache-2.0
基于facebook/wav2vec2-xls-r-1b在Common Voice 8马耳他语数据集上微调的自动语音识别模型
语音识别 Transformers 其他
W
RuudVelo
17
0
Wav2vec2 Large Xls R 300m Br D2
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在布列塔尼语(Common Voice 8.0)上微调的语音识别模型
语音识别 Transformers 其他
W
DrishtiSharma
21
0
Wav2vec2 Large Xlsr 53 Demo Colab
Apache-2.0
这是一个基于wav2vec2架构的自动语音识别模型,专门针对泰米尔语进行优化,支持尼泊尔语语音识别任务。
语音识别 Transformers 其他
W
Mahalakshmi
17
0
Wav2vec2 Large Xls R 300m Sl With LM V1
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在斯洛文尼亚语(Common Voice 8.0)数据集上微调的自动语音识别(ASR)模型,结合语言模型(LM)提升了识别效果。
语音识别 Transformers 其他
W
DrishtiSharma
25
0
Wav2vec2 Large Xls R 300m Hi Cv8
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在印地语Common Voice 8数据集上微调的自动语音识别(ASR)模型。
语音识别 Transformers 其他
W
DrishtiSharma
25
0
Wav2vec2 Xls R 300m German De
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - DE数据集上微调的德语自动语音识别模型。
语音识别 Transformers 德语
W
AndrewMcDowell
72
3
Wav2vec2 Large Xls R 300m Hindi Kaggle
基于common_voice数据集训练的印地语语音识别模型
语音识别 Transformers 其他
W
Saitomar
27
0
Wav2vec2 Large Xls R 300m Cv8 Nl
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在Common Voice 8荷兰语数据集上微调的自动语音识别模型,包含6元语法KenLM语言模型
语音识别 Transformers 其他
W
RuudVelo
22
0
Galician Xlsr
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在加利西亚语数据集上微调的自动语音识别模型,在Common Voice 8.0测试集上取得了11.31%的WER。
语音识别 Transformers 其他
G
Akashpb13
110
1
Wav2vec2 Large Xls R 300m Sat Final
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - SAT数据集上微调的自动语音识别模型,支持Santali (Ol Chiki)语言。
语音识别 Transformers 其他
W
DrishtiSharma
28
0
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase