wav2vec2-base-checkpoint-10開源語音識別模型 - 基於數據集微調、低錯誤率

Wav2vec2 Base Checkpoint 10

由jiobiala24開發

基於wav2vec2-base-checkpoint-9在common_voice數據集上微調的語音識別模型，在評估集上詞錯誤率為0.3292

下載量 16

發布時間 : 3/2/2022

模型概述

這是一個語音識別模型，基於wav2vec2架構，在common_voice數據集上進行了微調，能夠將語音轉換為文本。

低詞錯誤率

在評估集上取得了0.3292的詞錯誤率，表現良好

基於wav2vec2架構

採用wav2vec2-base架構，具有良好的語音特徵提取能力

微調優化

在common_voice數據集上進行了30輪微調訓練

語音轉文本

自動語音識別

語音轉錄

語音轉寫

將語音內容轉換為文字記錄

詞錯誤率0.3292

語音助手

語音指令識別

識別用戶的語音指令