低词错误率(WER)

# 低词错误率(WER)

W2v Bert Uk V2.1

基于facebook/w2v-bert-2.0的乌克兰语语音识别模型，在Yehor/openstt-uk数据集上微调

Transformers 其他

Asr Wav2vec2 Ctc French

这是一个基于wav2vec2-FR-7K-large模型微调的法语自动语音识别(ASR)模型，在超过2200小时的法语语音数据上训练而成。

Transformers 法语

Wav2vec2 Large Xlsr 53 842h Luxembourgish 14h With Lm

基于wav2vec 2.0大型XLSR-53检查点微调的卢森堡语语音识别模型，使用842小时未标注和14小时标注数据训练，并集成5-gram语言模型

Transformers 其他

Wav2vec En Finetuned On Cryptocurrency

该模型是基于facebook/wav2vec2-large-960h微调的语音识别模型，专门针对加密货币领域的播客内容进行了优化。

Transformers 英语

Wav2vec2 Base Vietnamese 250h

基于wav2vec 2.0架构的越南语自动语音识别模型，在13,000小时未标注音频和250小时标注数据上训练

Transformers 其他

Wav2vec2 Xlsr 300m Finnish Lm

基于Facebook wav2vec2-xls-r-300m模型微调的芬兰语自动语音识别(ASR)模型，使用275.6小时芬兰语数据训练，支持与KenLM语言模型配合解码

Transformers 其他

Wav2vec2 Large Xlsr 53 Dutch

基于facebook/wav2vec2-large-xlsr-53微调的荷兰语语音识别模型，在Common Voice和CSS10数据集上训练，支持16kHz音频输入。

语音识别其他

Wav2vec2 Xls R 1b Dutch

这是一个基于XLS-R 10亿参数模型微调的荷兰语自动语音识别(ASR)模型，在Common Voice 8.0等多个数据集上训练，支持16kHz采样率的语音输入。

Transformers 其他

Wav2vec2 Large Xlsr Catala

基于facebook/wav2vec2-large-xlsr-53模型微调的加泰罗尼亚语语音识别模型，在通用语音库和议会语音库数据上训练

语音识别其他

Wav2vec2 Large Xlsr 53 German

基于wav2vec-large-xlsr-53框架微调的德语语音识别模型，在CommonVoice德语测试集上达到11.26%词错误率

Wav2vec2 Xls R 300m Rm Sursilv D11

该模型是基于facebook/wav2vec2-xls-r-300m在罗曼什语-苏塞尔瓦方言数据集上微调的自动语音识别模型，在Common Voice 8测试集上取得了24.09%的词错误率(WER)。

Wav2vec2 Large XLSR 53 Portuguese

基于Facebook的wav2vec2-large-xlsr-53模型，使用公共语音数据集的葡萄牙语数据微调而成的语音识别模型

语音识别其他

Wav2vec2 Large Voxrex Swedish

基于VoxRex大型模型微调的瑞典语自动语音识别模型，支持16kHz采样率语音输入

Transformers 其他

Hindi Model With Lm Vakyansh

这是一个针对印地语的自动语音识别(ASR)模型，在Common Voice等数据集上表现出色。

Transformers 其他

Nb Wav2vec2 300m Nynorsk

基于VoxRex特征提取器微调的300M参数语音识别模型，专为新挪威语(Nynorsk)优化，在NPSC测试集上WER达12.22%

Transformers 其他

Wav2vec2 Large Xlsr 53 Spanish

基于facebook/wav2vec2-large-xlsr-53模型微调的西班牙语自动语音识别(ASR)模型，在Common Voice西班牙语数据集上训练，支持16kHz采样率的语音输入。

语音识别西班牙语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase