鲁棒语音处理

# 鲁棒语音处理

Wav2vec2 Large Robust 6 Ft Age Gender Finetuned Gtzan

基于wav2vec2架构的音频分类模型，在privateSLI数据集上微调，用于年龄和性别识别任务

languageresearch

Wav2vec2 Xls R 1b De Cv8

基于facebook/wav2vec2-xls-r-1b在Common Voice 8德语数据集上微调的自动语音识别模型

Transformers 德语

这是一个基于facebook/wav2vec2-xls-r-300m模型在Common Voice 8迪维希语数据集上微调的自动语音识别模型

Transformers 其他

Xls R 300 Sv Cv7

这是一个基于facebook/wav2vec2-xls-r-300m在瑞典语Common Voice 7.0数据集上微调的自动语音识别模型

Transformers 其他

patrickvonplaten

Wav2vec2 Large Xls R 1b Indonesian

基于facebook/wav2vec2-xls-r-1b在Common Voice印尼语数据集上微调的自动语音识别模型

Transformers 其他

Wav2vec2 Large Xls R 300m Hindi

这是一个基于facebook/wav2vec2-xls-r-300m模型在印地语数据集上微调的语音识别模型，支持印地语语音转文本任务。

Transformers 其他

Wav2vec2 Xls R 1b Japanese

该模型是基于facebook/wav2vec2-xls-r-1b在公共日语语音数据集上进行微调的版本，支持日语自动语音识别任务。

Transformers 日语

Wav2vec2 Large Xls R 300m Romansh Sursilvan

基于facebook/wav2vec2-xls-r-300m在罗曼什语苏塞尔瓦方言数据集上微调的自动语音识别模型

Wav2vec2 Base Turkish

该模型是基于Common Voice土耳其语数据集微调的Wav2Vec2语音识别模型，在土耳其语自动语音识别任务上表现优异。

Transformers 其他

Wav2vec2 Large Xlsr Coraa Portuguese Cv7

基于Edresson/wav2vec2-large-xlsr-coraa-portuguese在common_voice数据集上微调的葡萄牙语语音识别模型

Transformers 其他

Wav2vec2 Xls R 300m Italian Robust

基于facebook/wav2vec2-xls-r-300m在多个意大利语语音数据集上微调的自动语音识别模型

Transformers 其他

Wav2vec2 Xls R 300m Turkish Tr Small

这是一个基于facebook/wav2vec2-xls-r-300m模型在通用语音数据集上微调的土耳其语语音识别模型

这是一个基于facebook/wav2vec2-xls-r-2b模型微调的泰卢固语自动语音识别(ASR)模型，在OpenSLR SLR66数据集上训练

Transformers 其他

Wav2vec2 Xls R 1b Korean

该模型是基于facebook/wav2vec2-xls-r-1b在KRESNIK/ZEROTH_KOREAN - CLEAN数据集上微调的韩语自动语音识别模型

Transformers 韩语

Wav2vec2 Xls R 300m Indonesian

基于Facebook的XLS-R-300M模型在印度尼西亚语语音数据上微调的自动语音识别模型

Transformers 其他

Wav2vec2 Xls R Pt Cv7 From Bp400h

这是一个基于wav2vec2 XLS-R架构的葡萄牙语自动语音识别(ASR)模型，在Common Voice 7数据集上微调，在测试集上取得12.13%的词错误率(WER)。

Transformers 其他

Wav2vec2 Xls R 300m Lm Hebrew

基于facebook/wav2vec2-xls-r-300m微调的希伯来语语音识别模型，添加了n-gram语言模型增强

Transformers 其他

Wav2vec2 Indonesian Javanese Sundanese

这是一个支持印尼语、爪哇语和巽他语的多语种语音识别模型，基于facebook/wav2vec2-large-xlsr-53微调而成。

Transformers 其他

Wav2vec2 Large Xlsr 53 Demo Colab

该模型是基于facebook/wav2vec2-large-xlsr-53在common_voice数据集上微调得到的语音识别模型，主要用于鲁棒语音事件识别。

Wav2vec2 Large Xls R 300m Latvian

这是一个基于facebook/wav2vec2-xls-r-300m在拉脱维亚语数据集上微调的自动语音识别模型，在Common Voice 7测试集上取得了16.98%的WER。

Transformers 其他

Xls R Nl V1 Cv8 Lm

这是一个基于XLS-R架构的自动语音识别模型，专门针对荷兰语和佛兰芒语优化，结合了5-gram语言模型以提高识别准确率。

Transformers 其他

Xls R 2b Nl V2 Lm 5gram Os2 Hunspell

基于XLS-R的CTC模型，带有来自Open Subtitles的5-gram语言模型，主要用于荷兰语和佛兰芒语的自动语音识别。

Transformers 其他

Wav2vec2 Large Xls R 1b Cv8 Mt

基于facebook/wav2vec2-xls-r-1b在Common Voice 8马耳他语数据集上微调的自动语音识别模型

Transformers 其他

Wav2vec2 Large Xls R 300m Br D2

基于facebook/wav2vec2-xls-r-300m在布列塔尼语(Common Voice 8.0)上微调的语音识别模型

Transformers 其他

Wav2vec2 Large Xlsr 53 Demo Colab

这是一个基于wav2vec2架构的自动语音识别模型，专门针对泰米尔语进行优化，支持尼泊尔语语音识别任务。

Transformers 其他

Wav2vec2 Large Xls R 300m Sl With LM V1

这是一个基于facebook/wav2vec2-xls-r-300m模型在斯洛文尼亚语(Common Voice 8.0)数据集上微调的自动语音识别(ASR)模型，结合语言模型(LM)提升了识别效果。

Transformers 其他

Wav2vec2 Large Xls R 300m Hi Cv8

这是一个基于facebook/wav2vec2-xls-r-300m模型在印地语Common Voice 8数据集上微调的自动语音识别(ASR)模型。

Transformers 其他

Wav2vec2 Xls R 300m German De

该模型是基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - DE数据集上微调的德语自动语音识别模型。

Transformers 德语

Wav2vec2 Large Xls R 300m Hindi Kaggle

基于common_voice数据集训练的印地语语音识别模型

Transformers 其他

Wav2vec2 Large Xls R 300m Cv8 Nl

基于facebook/wav2vec2-xls-r-300m在Common Voice 8荷兰语数据集上微调的自动语音识别模型，包含6元语法KenLM语言模型

Transformers 其他

该模型是基于facebook/wav2vec2-xls-r-300m在加利西亚语数据集上微调的自动语音识别模型，在Common Voice 8.0测试集上取得了11.31%的WER。

Transformers 其他

Wav2vec2 Large Xls R 300m Sat Final

这是一个基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - SAT数据集上微调的自动语音识别模型，支持Santali (Ol Chiki)语言。

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase