W

Wav2vec2 Urdu

由 kingabzpro 开发
基于wav2vec2架构的乌尔都语自动语音识别模型,在Common Voice数据集上微调
下载量 101
发布时间 : 3/2/2022

模型简介

这是一个针对乌尔都语优化的自动语音识别(ASR)模型,基于Facebook的wav2vec2架构,在Common Voice乌尔都语数据集上进行了微调。

模型特点

乌尔都语优化
专门针对乌尔都语语音识别任务进行优化
基于wav2vec2架构
采用Facebook强大的wav2vec2架构,具有良好的语音特征提取能力
小样本微调
在有限的乌尔都语语音数据(0.58小时)上进行微调

模型能力

乌尔都语语音识别
语音转文本
自动语音识别

使用案例

语音转录
乌尔都语语音转录
将乌尔都语语音转换为文本
词错误率57.47%,字符错误率32.68%
语音助手
乌尔都语语音指令识别
用于乌尔都语语音助手或控制系统的语音指令识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase