S

Sew D Mid 400k Librispeech Clean 100h Ft

Developed by patrickvonplaten
该模型是基于asapp/sew-d-mid-400k在LIBRISPEECH_ASR - CLEAN数据集上微调得到的自动语音识别模型,在评估集上取得了1.0536的词错误率(WER)。
Downloads 15
Release Time : 3/2/2022

Model Overview

一个针对英语语音识别任务优化的模型,特别适用于LibriSpeech数据集中的干净语音样本。

Model Features

高效语音识别
基于SEW-D架构优化,提供高效的语音转文本能力
低词错误率
在LibriSpeech clean 100h数据集上达到1.0536的WER
多GPU训练优化
支持分布式训练,优化了多GPU环境下的性能

Model Capabilities

英语语音识别
高精度转录
处理干净语音样本

Use Cases

语音转录
有声书转录
将高质量的有声读物内容转换为文本
高准确率的转录结果
会议记录
在安静环境下进行会议语音记录
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase