W

Wavlm Libri Clean 100h Large

由patrickvonplaten開發
基於microsoft/wavlm-large在LIBRISPEECH_ASR - CLEAN數據集上微調的自動語音識別模型
下載量 8,171
發布時間 : 3/2/2022

模型概述

該模型是WavLM-Large架構在LibriSpeech clean-100h數據集上的微調版本,專注於英語語音識別任務,在評估集上取得了較低的詞錯誤率(WER)。

模型特點

高性能語音識別
在LibriSpeech clean-100h數據集上微調後,詞錯誤率(WER)低至0.0491
基於WavLM-Large架構
採用微軟WavLM-Large預訓練模型作為基礎,具有強大的語音特徵提取能力
多GPU訓練優化
使用8個GPU進行分佈式訓練,通過梯度累積等技術優化訓練效率

模型能力

英語語音識別
高精度語音轉文本
連續語音識別

使用案例

語音轉錄
有聲書轉錄
將英語有聲讀物內容自動轉錄為文本
在LibriSpeech評估集上詞錯誤率4.91%
語音助手
語音指令識別
用於智能設備中的英語語音指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase