W

Wav2vec2 Large Xls R 1b Swedish

由kingabzpro開發
該模型是基於facebook/wav2vec2-xls-r-1b在Common Voice瑞典語數據集上微調的自動語音識別模型,支持瑞典語語音轉文本任務。
下載量 844
發布時間 : 3/2/2022

模型概述

一個針對瑞典語優化的自動語音識別模型,基於wav2vec2-xls-r-1b架構,在Common Voice 8.0數據集上微調,支持高精度瑞典語語音識別。

模型特點

高性能瑞典語識別
在Common Voice瑞典語測試集上達到14.04%的詞錯誤率(WER)和4.86%的字符錯誤率(CER)
基於大模型微調
基於10億參數的wav2vec2-xls-r-1b模型微調,具備強大的語音特徵提取能力
支持語言模型集成
可結合語言模型進一步提升識別準確率,相比無語言模型降低約4%的WER

模型能力

瑞典語語音識別
語音轉文本
長音頻處理(支持分塊處理)

使用案例

語音轉錄
瑞典語語音內容轉錄
將瑞典語語音內容轉換為文本格式
在Common Voice測試集上達到14.04% WER
語音助手
瑞典語語音指令識別
用於瑞典語語音助手系統中的指令識別
在魯棒語音事件數據集上達到29.69% WER
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase