W

Wav2vec2 Bn 300m

由Tahsin-Mayeesha開發
基於facebook/wav2vec2-xls-r-300m微調的孟加拉語自動語音識別模型,使用OPENSLR_SLR53數據集訓練
下載量 25
發布時間 : 3/2/2022

模型概述

這是一個針對孟加拉語優化的自動語音識別(ASR)模型,基於wav2vec2-xls-r-300m架構微調,在OpenSLR數據集上表現出色

模型特點

高精度孟加拉語識別
在OpenSLR測試集上達到17.78%的詞錯誤率(WER)和4.39%的字錯誤率(CER)
支持語言模型集成
可結合5-gram語言模型進一步提升識別準確率
大規模訓練數據
使用OPENSLR_SLR53數據集中的218,703條樣本進行訓練

模型能力

孟加拉語語音識別
語音轉文本
支持語言模型增強

使用案例

語音轉錄
孟加拉語語音轉寫
將孟加拉語語音內容轉換為文本
在測試集上達到0.17776 WER(帶語言模型)
語音助手
孟加拉語語音交互
為孟加拉語語音助手提供語音識別能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase