S

Sew D Mid 400k Librispeech Clean 100h Ft

由 patrickvonplaten 开发
该模型是基于asapp/sew-d-mid-400k在LIBRISPEECH_ASR - CLEAN数据集上微调得到的自动语音识别模型,在评估集上取得了1.0536的词错误率(WER)。
下载量 15
发布时间 : 3/2/2022

模型简介

一个针对英语语音识别任务优化的模型,特别适用于LibriSpeech数据集中的干净语音样本。

模型特点

高效语音识别
基于SEW-D架构优化,提供高效的语音转文本能力
低词错误率
在LibriSpeech clean 100h数据集上达到1.0536的WER
多GPU训练优化
支持分布式训练,优化了多GPU环境下的性能

模型能力

英语语音识别
高精度转录
处理干净语音样本

使用案例

语音转录
有声书转录
将高质量的有声读物内容转换为文本
高准确率的转录结果
会议记录
在安静环境下进行会议语音记录
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase