wav2vec2-final-1-lm-2開源語音識別模型 - 低錯誤率精準識別語音內容

Wav2vec2 Final 1 Lm 2

由chrisvinsen開發

基於facebook/wav2vec2-base微調的語音識別模型，詞錯誤率(WER)0.283，使用3元語法時詞錯誤率0.126

下載量 15

發布時間 : 6/2/2022

模型概述

這是一個用於語音識別的微調模型，基於wav2vec2架構，在特定數據集上訓練得到

低詞錯誤率

在評估集上詞錯誤率為0.4499，使用3元語法時降至0.126

基於wav2vec2架構

採用facebook的wav2vec2-base作為基礎模型進行微調

優化訓練

經過60輪訓練，採用線性學習率調度和預熱策略

語音識別

音頻轉文本

語音轉錄

會議記錄轉錄

將會議錄音轉換為文字記錄

詞錯誤率0.283

語音指令識別

識別和理解語音指令