W

Wav2vec2 Xls R 300m Bangla Command

由sshasnain開發
這是一個基於wav2vec2 XLS-R架構的300M參數孟加拉語語音識別模型,專門優化用於指令識別任務。
下載量 28
發布時間 : 3/2/2022

模型概述

該模型是一個自動語音識別(ASR)系統,專門設計用於理解和轉寫孟加拉語的口頭指令。它基於Facebook的wav2vec2 XLS-R架構,具有300M參數規模。

模型特點

高精度孟加拉語識別
在測試集上達到0.006的詞錯誤率(WER),表現優異
指令優化
專門針對日常指令場景進行優化訓練
基於wav2vec2 XLS-R
採用先進的wav2vec2 XLS-R 300M參數架構

模型能力

孟加拉語語音識別
指令理解
語音轉文本

使用案例

智能家居控制
設備控制
通過語音指令控制智能家居設備
準確識別並執行家居控制指令
零售場景
價格查詢
識別顧客詢問商品價格的語音
準確轉寫價格查詢內容
日常助手
物品查找
幫助用戶查找家中物品位置
準確理解物品位置相關詢問
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase