W

Wavlm Libri Clean 100h Base

由patrickvonplaten開發
基於microsoft/wavlm-base在LIBRISPEECH_ASR - CLEAN數據集上微調的自動語音識別模型
下載量 6,515
發布時間 : 3/2/2022

模型概述

該模型是針對英語語音識別任務優化的WavLM基礎版本,在100小時乾淨語音數據上進行了微調,具有較低的詞錯誤率。

模型特點

高效微調
在100小時乾淨語音數據上進行微調,顯著提升了基礎模型的識別準確率
低詞錯誤率
在評估集上取得了0.0675的詞錯誤率(WER),表現優異
多GPU訓練
採用8個GPU進行分佈式訓練,提高了訓練效率

模型能力

英語語音識別
連續語音轉文本
高準確率轉錄

使用案例

語音轉錄
會議記錄自動生成
將會議錄音自動轉換為文字記錄
準確率約93.25%(基於WER 0.0675計算)
播客內容索引
為音頻播客節目生成可搜索的文字內容
輔助技術
即時字幕生成
為視頻或直播內容提供即時字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase