W

Wav2vec2 Large Xls R 300m Sl With LM V2

由DrishtiSharma開發
這是一個基於facebook/wav2vec2-xls-r-300m在斯洛文尼亞語(common_voice_8_0)數據集上微調的自動語音識別(ASR)模型,支持語言模型(LM)增強。
下載量 26
發布時間 : 3/2/2022

模型概述

該模型專門用於斯洛文尼亞語的語音識別任務,在Common Voice 8數據集上表現出色,支持語言模型增強以提高識別準確率。

模型特點

語言模型增強
支持語言模型(LM)增強,顯著提高識別準確率(WER從0.217降至0.146)
多數據集驗證
在Common Voice 8和魯棒語音事件數據集上進行了全面評估
高效訓練
採用混合精度訓練和線性學習率調度器優化訓練過程

模型能力

斯洛文尼亞語語音識別
長音頻處理(支持分塊處理)
語言模型集成

使用案例

語音轉錄
語音轉文字
將斯洛文尼亞語語音轉換為文字
在Common Voice 8測試集上達到WER 0.217(無LM)/0.146(有LM)
語音助手
斯洛文尼亞語語音指令識別
用於語音助手或語音控制系統的指令識別
在魯棒語音事件測試集上WER 46.69
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase