W

Wavlm Base Libri Clean 100

由 anjulRajendraSharma 开发
基于WavLM架构的自动语音识别模型,在LibriSpeech CLEAN数据集(100小时)上微调
下载量 73
发布时间 : 3/2/2022

模型简介

该模型是微软WavLM-base模型的微调版本,专门用于英语语音识别任务,在LibriSpeech CLEAN数据集上表现出色

模型特点

高精度语音识别
在LibriSpeech CLEAN测试集上达到7.73%的词错误率
基于WavLM架构
采用微软先进的WavLM自监督学习架构,具有强大的语音特征提取能力
轻量级微调
仅使用100小时的干净语音数据进行微调,保持基础模型的泛化能力

模型能力

英语语音识别
音频转文本
语音内容理解

使用案例

语音转录
会议记录自动转录
将会议录音自动转换为文字记录
准确率约92.27%(基于7.73% WER)
播客内容索引
为播客音频创建可搜索的文字索引
辅助技术
听力障碍辅助
实时将语音转换为文字显示
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase