# 低词错误率(WER)

W2v Bert Uk V2.1
Apache-2.0
基于facebook/w2v-bert-2.0的乌克兰语语音识别模型,在Yehor/openstt-uk数据集上微调
语音识别 Transformers 其他
W
Yehor
492
1
Asr Wav2vec2 Ctc French
Apache-2.0
这是一个基于wav2vec2-FR-7K-large模型微调的法语自动语音识别(ASR)模型,在超过2200小时的法语语音数据上训练而成。
语音识别 Transformers 法语
A
bofenghuang
520
12
Wav2vec2 Large Xlsr 53 842h Luxembourgish 14h With Lm
MIT
基于wav2vec 2.0大型XLSR-53检查点微调的卢森堡语语音识别模型,使用842小时未标注和14小时标注数据训练,并集成5-gram语言模型
语音识别 Transformers 其他
W
Lemswasabi
170
6
Wav2vec En Finetuned On Cryptocurrency
MIT
该模型是基于facebook/wav2vec2-large-960h微调的语音识别模型,专门针对加密货币领域的播客内容进行了优化。
语音识别 Transformers 英语
W
distractedm1nd
22
1
Wav2vec2 Base Vietnamese 250h
基于wav2vec 2.0架构的越南语自动语音识别模型,在13,000小时未标注音频和250小时标注数据上训练
语音识别 Transformers 其他
W
nguyenvulebinh
6,868
39
Wav2vec2 Xlsr 300m Finnish Lm
Apache-2.0
基于Facebook wav2vec2-xls-r-300m模型微调的芬兰语自动语音识别(ASR)模型,使用275.6小时芬兰语数据训练,支持与KenLM语言模型配合解码
语音识别 Transformers 其他
W
aapot
15
0
Wav2vec2 Large Xlsr 53 Dutch
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53微调的荷兰语语音识别模型,在Common Voice和CSS10数据集上训练,支持16kHz音频输入。
语音识别 其他
W
jonatasgrosman
3.0M
12
Wav2vec2 Xls R 1b Dutch
Apache-2.0
这是一个基于XLS-R 10亿参数模型微调的荷兰语自动语音识别(ASR)模型,在Common Voice 8.0等多个数据集上训练,支持16kHz采样率的语音输入。
语音识别 Transformers 其他
W
jonatasgrosman
146
2
Wav2vec2 Large Xlsr Catala
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的加泰罗尼亚语语音识别模型,在通用语音库和议会语音库数据上训练
语音识别 其他
W
softcatala
64.30k
0
Wav2vec2 Large Xlsr 53 German
基于wav2vec-large-xlsr-53框架微调的德语语音识别模型,在CommonVoice德语测试集上达到11.26%词错误率
语音识别
W
Noricum
33
0
Wav2vec2 Xls R 300m Rm Sursilv D11
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在罗曼什语-苏塞尔瓦方言数据集上微调的自动语音识别模型,在Common Voice 8测试集上取得了24.09%的词错误率(WER)。
语音识别 Transformers
W
DrishtiSharma
20
0
Wav2vec2 Large XLSR 53 Portuguese
Apache-2.0
基于Facebook的wav2vec2-large-xlsr-53模型,使用公共语音数据集的葡萄牙语数据微调而成的语音识别模型
语音识别 其他
W
Rubens
20
0
Wav2vec2 Large Voxrex Swedish
基于VoxRex大型模型微调的瑞典语自动语音识别模型,支持16kHz采样率语音输入
语音识别 Transformers 其他
W
KBLab
101.28k
12
Hindi Model With Lm Vakyansh
Apache-2.0
这是一个针对印地语的自动语音识别(ASR)模型,在Common Voice等数据集上表现出色。
语音识别 Transformers 其他
H
Harveenchadha
27
5
Nb Wav2vec2 300m Nynorsk
Apache-2.0
基于VoxRex特征提取器微调的300M参数语音识别模型,专为新挪威语(Nynorsk)优化,在NPSC测试集上WER达12.22%
语音识别 Transformers 其他
N
NbAiLab
73.53k
0
Wav2vec2 Large Xlsr 53 Spanish
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的西班牙语自动语音识别(ASR)模型,在Common Voice西班牙语数据集上训练,支持16kHz采样率的语音输入。
语音识别 西班牙语
W
LuisG07
50
0
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase