wavlm-libri-clean-100h-large开源自动语音识别模型 - 免费部署精准识别语音内容

Wavlm Libri Clean 100h Large

由 patrickvonplaten 开发

基于microsoft/wavlm-large在LIBRISPEECH_ASR - CLEAN数据集上微调的自动语音识别模型

下载量 8,171

发布时间 : 3/2/2022

模型简介

该模型是WavLM-Large架构在LibriSpeech clean-100h数据集上的微调版本，专注于英语语音识别任务，在评估集上取得了较低的词错误率(WER)。

高性能语音识别

在LibriSpeech clean-100h数据集上微调后，词错误率(WER)低至0.0491

基于WavLM-Large架构

采用微软WavLM-Large预训练模型作为基础，具有强大的语音特征提取能力

多GPU训练优化

使用8个GPU进行分布式训练，通过梯度累积等技术优化训练效率

英语语音识别

高精度语音转文本

连续语音识别

语音转录

有声书转录

将英语有声读物内容自动转录为文本

在LibriSpeech评估集上词错误率4.91%

语音助手

语音指令识别

用于智能设备中的英语语音指令识别

训练损失	轮数	步数	验证损失	字错率（Wer）
0.8069	0.34	300	0.7510	0.5809
0.2483	0.67	600	0.2023	0.1929
0.1033	1.01	900	0.1123	0.1028
0.0742	1.35	1200	0.0858	0.0771
0.057	1.68	1500	0.0722	0.0663
0.0421	2.02	1800	0.0682	0.0582
0.0839	2.35	2100	0.0630	0.0534
0.0307	2.69	2400	0.0603	0.0508