W

Wav2vec2 Xls R 300m Bangla Command Generated Data Finetune

由hrdipto開發
基於wav2vec2-xls-r-300m架構的孟加拉語語音識別模型,針對命令識別任務進行了微調
下載量 24
發布時間 : 3/2/2022

模型概述

該模型是在hrdipto/wav2vec2-xls-r-300m-bangla-command-data基礎上進行微調的版本,專門用於孟加拉語命令識別任務

模型特點

高效語音識別
針對孟加拉語命令識別進行了優化,評估詞錯誤率僅為0.0208
快速推理
評估時每秒可處理75.217個樣本,適合即時應用場景
遷移學習
基於預訓練的wav2vec2-xls-r-300m模型進行微調,充分利用預訓練知識

模型能力

孟加拉語語音識別
命令詞識別
即時語音處理

使用案例

智能家居控制
語音控制設備
通過孟加拉語語音命令控制智能家居設備
高準確率的命令識別
語音助手
本地化語音交互
為孟加拉語用戶提供語音交互功能
低延遲的語音識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase