W

Wav2vec2 Xls R 300m Bangla Command Word Combination Synthetic

由sshasnain開發
基於facebook/wav2vec2-xls-r-300m微調的孟加拉語語音識別模型,專注於指令詞識別
下載量 15
發布時間 : 3/2/2022

模型概述

這是一個針對孟加拉語指令詞優化的語音識別模型,基於wav2vec2-xls-r-300m架構微調,適用於特定領域的語音指令識別任務

模型特點

孟加拉語優化
專門針對孟加拉語語音識別進行優化,特別是指令詞識別場景
合成數據訓練
使用合成語音數據進行訓練,增強模型對特定指令詞的識別能力
高效識別
在保持模型規模適中的情況下(300M參數),實現較好的識別準確率

模型能力

孟加拉語語音識別
指令詞識別
語音轉文本

使用案例

智能家居控制
孟加拉語語音控制
用於識別孟加拉語智能家居控制指令
詞錯誤率0.4111
語音助手
本地化語音交互
為孟加拉語用戶提供本地化的語音交互體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase