W

Wav2vec2 Large Xls R 300m Kk With LM

由DrishtiSharma開發
該模型是基於facebook/wav2vec2-xls-r-300m在哈薩克語(KK)數據集上微調的自動語音識別(ASR)模型,支持語言模型(LM)增強
下載量 22
發布時間 : 3/2/2022

模型概述

這是一個針對哈薩克語優化的自動語音識別模型,在Common Voice 8.0數據集上訓練,可用於將哈薩克語語音轉換為文本

模型特點

語言模型增強
模型結合了語言模型(LM)進行後處理,提高了識別準確率
多數據集評估
在Common Voice和魯棒語音事件等多個數據集上進行評估
大規模預訓練
基於300M參數的wav2vec2-XLS-R模型微調,具有強大的語音特徵提取能力

模型能力

哈薩克語語音識別
語音轉文本
支持語言模型後處理

使用案例

語音轉錄
哈薩克語語音轉錄
將哈薩克語語音內容轉換為文本
在Common Voice 8.0測試集上WER為41.7%
語音助手
哈薩克語語音指令識別
用於哈薩克語語音助手或控制系統的語音指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase