wav2vec2語音識別模型 - 開源免費，基於數據集訓練實現低詞錯誤率識別

Wav2vec2 2 Bert Large No Adapter Frozen Enc

由speech-seq2seq開發

該模型是基於librispeech_asr數據集訓練的語音識別模型，在評估集上取得了2.0133的詞錯誤率(WER)。

下載量 25

發布時間 : 3/2/2022

模型概述

這是一個自動語音識別(ASR)模型，能夠將語音轉換為文本。模型基於librispeech_asr數據集訓練，適用於英語語音識別任務。

低詞錯誤率

在評估集上取得了2.0133的詞錯誤率(WER)，表現良好

基於LibriSpeech訓練

使用標準的librispeech_asr數據集進行訓練，具有可靠的訓練基礎

優化的訓練配置

採用了梯度累積、學習率預熱和混合精度訓練等優化技術

英語語音識別

語音轉文本

語音轉錄

音頻轉錄

將英語語音內容轉換為文本

詞錯誤率2.0133

輔助工具

字幕生成

為英語視頻內容自動生成字幕

null