W

Wav2vec2 Xls R 1b English

由 jonatasgrosman 开发
这是一个基于XLS-R 1B架构的英语语音识别模型,在多个英语语音数据集上进行了微调。
下载量 1,896
发布时间 : 3/2/2022

模型简介

该模型针对英语语音识别任务进行了优化,能够将英语语音转换为文本。

模型特点

多数据集训练
使用Common Voice 8.0、Multilingual LibriSpeech、TED-LIUMv3和Voxpopuli等多个数据集进行训练
高性能
在Common Voice 8测试集上达到21.05%的WER和8.44%的CER
支持语言模型
可以结合语言模型(LM)使用,进一步提升识别准确率

模型能力

英语语音识别
实时语音转文本
支持16kHz采样率音频处理

使用案例

语音转录
会议记录
将英语会议录音自动转换为文字记录
准确率约80% (WER 20%)
播客转录
将英语播客内容转换为文字稿
辅助技术
语音输入系统
为残障人士提供语音输入解决方案
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase