W

Wav2vec2 Large Xlsr Bengali

由tanmoyio開發
基於facebook/wav2vec2-large-xlsr-53模型微調的孟加拉語自動語音識別模型,使用OpenSLR數據集訓練。
下載量 24.32k
發布時間 : 3/2/2022

模型概述

該模型是一個針對孟加拉語優化的自動語音識別(ASR)模型,基於Facebook的wav2vec2-large-xlsr-53架構微調,支持16kHz採樣率的語音輸入。

模型特點

孟加拉語優化
專門針對孟加拉語語音識別任務進行微調
無需語言模型
可直接使用,不需要額外的語言模型支持
大規模訓練數據
使用約19.6萬條孟加拉語語句進行訓練

模型能力

孟加拉語語音識別
音頻轉錄
語音轉文本

使用案例

語音轉錄
孟加拉語語音轉錄
將孟加拉語語音轉換為文本
詞錯誤率88.58%
語音助手
孟加拉語語音指令識別
用於支持孟加拉語的語音助手應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase