wav2vec2-xls-r-pa-IN-a1開源自動語音識別模型 - 精準識別旁遮普語(印度)語音

Wav2vec2 Xls R Pa IN A1

由DrishtiSharma開發

基於Facebook的wav2vec2-xls-r-300m模型在Common Voice 8.0旁遮普語(印度)數據集上微調的自動語音識別模型

下載量 20

發布時間 : 3/2/2022

模型概述

該模型專門用於旁遮普語(印度方言)的語音識別任務，能夠將語音轉換為文本

高精度識別

在評估集上達到0.4908的詞錯誤率(WER)

大規模預訓練

基於Facebook的wav2vec2-xls-r-300m模型微調，具有強大的語音特徵提取能力

特定語言優化

專門針對旁遮普語(印度方言)進行優化訓練

語音轉文本

旁遮普語(印度)語音識別

即時語音處理

語音轉寫

語音備忘錄轉錄

將旁遮普語(印度)的語音備忘錄轉換為可搜索的文本

準確率約51% (WER 0.4908)

輔助技術

語音控制應用

為旁遮普語用戶開發的語音控制界面

屬性	詳情
模型類型	基於 facebook/wav2vec2-xls-r-300m 微調的自動語音識別模型
訓練數據	MOZILLA - FOUNDATION/COMMON_VOICE_8_0 - PA - IN 數據集
許可證	Apache - 2.0