W

Wav2vec2 Large Xls R 300m Sl With LM V1

由DrishtiSharma開發
這是一個基於facebook/wav2vec2-xls-r-300m模型在斯洛文尼亞語(Common Voice 8.0)數據集上微調的自動語音識別(ASR)模型,結合語言模型(LM)提升了識別效果。
下載量 25
發布時間 : 3/2/2022

模型概述

該模型專門用於斯洛文尼亞語的語音識別任務,在Common Voice 8.0數據集上取得了較好的識別準確率。

模型特點

語言模型增強
結合語言模型(LM)顯著提升了識別準確率,WER從20.6%降至13.5%
多數據集驗證
在Common Voice和魯棒語音事件等多個數據集上進行了驗證
高效訓練
使用混合精度訓練和線性學習率調度器優化訓練過程

模型能力

斯洛文尼亞語語音識別
長音頻處理(支持分塊處理)
高準確率字符識別(CER 3.8%)

使用案例

語音轉文字
語音轉錄
將斯洛文尼亞語語音轉換為文字
在Common Voice測試集上WER 13.5%
語音助手
語音指令識別
識別斯洛文尼亞語語音命令
在魯棒語音事件測試集上WER 46.17%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase