W

Wav2vec2 Large Tedlium

由 sanchit-gandhi 开发
基于TEDLIUM语料库微调的Wav2Vec2大型语音识别模型,支持英语语音转文本
下载量 58
发布时间 : 7/4/2022

模型简介

该模型是基于TEDLIUM语料库微调的Wav2Vec2大型模型,专门用于英语语音识别任务。

模型特点

高精度语音识别
在TEDLIUM测试集上达到8.2%的词错误率(WER)
大规模预训练
基于LibriVox 60,000小时音频预训练
领域适应
在452小时TED演讲数据上进行了微调

模型能力

英语语音识别
长音频处理
16kHz采样率音频处理

使用案例

语音转录
TED演讲转录
将TED演讲音频转换为文本
8.4% WER(开发集)
教育内容转录
将教育讲座和演讲内容转换为文本
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase