W

Wavlm Libri Clean 100h Base Plus

由patrickvonplaten開發
基於microsoft/wavlm-base-plus在LIBRISPEECH_ASR - CLEAN數據集上微調的自動語音識別模型
下載量 126.17k
發布時間 : 3/2/2022

模型概述

該模型是針對英語語音識別任務優化的WavLM模型,在LibriSpeech clean-100h數據集上進行了微調,取得了較低的詞錯誤率(WER)。

模型特點

高效微調
基於預訓練的WavLM-base-plus模型進行微調,充分利用預訓練模型的強大特徵提取能力
低詞錯誤率
在評估集上取得了0.0683的詞錯誤率(WER),表現出色
多GPU訓練優化
採用8GPU並行訓練,總批次大小達到32,訓練效率高

模型能力

英語語音識別
連續語音轉文本
高準確率轉錄

使用案例

語音轉錄
有聲書轉錄
將英語有聲讀物內容自動轉錄為文本
在LibriSpeech數據集上達到6.83%的詞錯誤率
會議記錄
將英語會議錄音自動轉換為文字記錄
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase