wav2vec2-large-xls-r-1B-common_voice7-lt-ft開源語音識別模型

Wav2vec2 Large Xls R 1B Common Voice7 Lt Ft

由reach-vb開發

基於facebook/wav2vec2-xls-r-1b在通用語音數據集上微調的語音識別模型

下載量 20

發布時間 : 3/2/2022

模型概述

該模型是wav2vec2-xls-r-1b的微調版本，專注於語音識別任務，在評估集上表現出色

大規模預訓練模型微調

基於10億參數的wav2vec2-xls-r-1b模型進行微調，具備強大的語音特徵提取能力

低詞錯誤率

在評估集上取得了1.0的詞錯誤率(WER)，表現優異

高效訓練

採用混合精度訓練和梯度累積等技術優化訓練效率

語音轉文本

自動語音識別

語音轉錄

語音轉文字服務

將語音內容轉換為文字記錄

高準確率的轉錄結果

輔助技術

語音控制界面

為殘障人士提供語音控制功能