A

Asr Wav2vec2 Commonvoice En

Developed by speechbrain
这是一个基于CommonVoice英语数据集训练的端到端自动语音识别系统,结合了wav2vec 2.0预训练模型和CTC解码器。
Downloads 681
Release Time : 3/2/2022

Model Overview

该模型用于英语语音识别任务,采用wav2vec 2.0作为声学特征提取器,并结合CTC解码器进行端到端训练。

Model Features

端到端语音识别
结合wav2vec 2.0预训练模型和CTC解码器,实现完整的语音识别流程
无语言模型依赖
系统不依赖外部语言模型,简化了部署流程
自动音频预处理
内置音频标准化处理,包括重采样和单声道选择

Model Capabilities

英语语音识别
音频转录
批量语音处理

Use Cases

语音转录
会议记录自动转录
将英语会议录音自动转换为文字记录
词错误率15.69%(在CommonVoice测试集上)
语音笔记转换
将语音备忘录转换为可编辑文本
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase