W

Wav2vec2 Xls R Pa IN A1

由DrishtiSharma開發
基於Facebook的wav2vec2-xls-r-300m模型在Common Voice 8.0旁遮普語(印度)數據集上微調的自動語音識別模型
下載量 20
發布時間 : 3/2/2022

模型概述

該模型專門用於旁遮普語(印度方言)的語音識別任務,能夠將語音轉換為文本

模型特點

高精度識別
在評估集上達到0.4908的詞錯誤率(WER)
大規模預訓練
基於Facebook的wav2vec2-xls-r-300m模型微調,具有強大的語音特徵提取能力
特定語言優化
專門針對旁遮普語(印度方言)進行優化訓練

模型能力

語音轉文本
旁遮普語(印度)語音識別
即時語音處理

使用案例

語音轉寫
語音備忘錄轉錄
將旁遮普語(印度)的語音備忘錄轉換為可搜索的文本
準確率約51% (WER 0.4908)
輔助技術
語音控制應用
為旁遮普語用戶開發的語音控制界面
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase