W

Wav2vec2 Xls R 300m Ur Cv9 With Lm

由 anuragshas 开发
该模型是基于facebook/wav2vec2-xls-r-300m在乌尔都语语音数据集上微调的自动语音识别(ASR)模型
下载量 18
发布时间 : 5/4/2022

模型简介

这是一个针对乌尔都语优化的语音识别模型,在Common Voice 9.0乌尔都语数据集上训练,能够将乌尔都语语音转换为文本

模型特点

乌尔都语优化
专门针对乌尔都语语音识别任务进行微调
高性能
在Common Voice测试集上达到23.75%的词错误率(WER)和8.31%的字错误率(CER)
基于XLS-R架构
采用Facebook强大的XLS-R(跨语言语音表示)架构

模型能力

乌尔都语语音识别
语音转文本
自动转录

使用案例

语音转录
乌尔都语语音转录
将乌尔都语语音内容转换为文本
准确率达到76.25%(WER 23.75%)
语音助手
乌尔都语语音指令识别
用于乌尔都语语音助手和命令控制系统
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase