W

Wav2vec2 Xlsr Multilingual 53 Fa

由 masoudmzb 开发
基于wav2vec 2.0架构的多语言语音识别模型,专门针对波斯语进行微调,显著降低词错误率
下载量 83
发布时间 : 3/2/2022

模型简介

该模型是基于facebook/wav2vec2-large-xlsr-53在波斯语数据集上微调的语音识别模型,支持16kHz采样率的语音输入,适用于波斯语自动语音识别任务

模型特点

多语言预训练基础
基于XLSR-53多语言模型微调,受益于跨语言学习能力
高性能波斯语识别
在私有测试集上词错误率(WER)仅为0.408,显著优于基础模型
数据增强效果
结合Common Voice和自建数据集训练,数据量增加带来性能提升

模型能力

波斯语语音识别
16kHz音频处理
端到端语音转文本

使用案例

语音转录
波斯语语音转写
将波斯语语音内容转换为文本
词错误率0.408
语音助手
波斯语语音交互
为波斯语语音助手提供识别能力
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase