W

Wavlm Libri Clean 100h Large

由 patrickvonplaten 开发
基于microsoft/wavlm-large在LIBRISPEECH_ASR - CLEAN数据集上微调的自动语音识别模型
下载量 8,171
发布时间 : 3/2/2022

模型简介

该模型是WavLM-Large架构在LibriSpeech clean-100h数据集上的微调版本,专注于英语语音识别任务,在评估集上取得了较低的词错误率(WER)。

模型特点

高性能语音识别
在LibriSpeech clean-100h数据集上微调后,词错误率(WER)低至0.0491
基于WavLM-Large架构
采用微软WavLM-Large预训练模型作为基础,具有强大的语音特征提取能力
多GPU训练优化
使用8个GPU进行分布式训练,通过梯度累积等技术优化训练效率

模型能力

英语语音识别
高精度语音转文本
连续语音识别

使用案例

语音转录
有声书转录
将英语有声读物内容自动转录为文本
在LibriSpeech评估集上词错误率4.91%
语音助手
语音指令识别
用于智能设备中的英语语音指令识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase