W

Wav2vec2 Xls R 300m Bengali

由arijitx開發
基於facebook/wav2vec2-xls-r-300m模型微調的孟加拉語自動語音識別模型,在OpenSLR_SLR53數據集上訓練
下載量 533
發布時間 : 3/2/2022

模型概述

這是一個針對孟加拉語優化的自動語音識別(ASR)模型,基於Facebook的wav2vec2-xls-r-300m架構微調而成,專門處理孟加拉語語音轉文本任務。

模型特點

高精度孟加拉語識別
在OpenSLR_SLR53測試集上取得0.153的詞錯誤率(WER)和0.034的字錯誤率(CER)
支持語言模型集成
可結合5-gram語言模型進一步提升識別準確率
專業數據集訓練
使用OpenSLR_SLR53孟加拉語專業數據集進行微調
優化的訓練參數
採用音頻時間掩碼(0.75概率)和特徵掩碼(0.25概率)等數據增強技術

模型能力

孟加拉語語音識別
語音轉文本
支持語言模型集成

使用案例

語音轉錄
孟加拉語會議記錄
將孟加拉語會議錄音自動轉錄為文字記錄
準確率達84.7%(WER 0.153)
語音助手
為孟加拉語語音助手提供語音識別能力
教育
語言學習應用
幫助學習者練習孟加拉語發音和聽力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase