W

Wav2vec2 Large Xlsr 53 Swedish

由KBLab開發
基於facebook/wav2vec2-large-xlsr-53框架微調的瑞典語自動語音識別模型,支持16kHz採樣率的語音輸入
下載量 30.51k
發布時間 : 3/2/2022

模型概述

這是一個專門針對瑞典語優化的自動語音識別(ASR)模型,基於大規模XLSR-53架構,在瑞典NST聽寫語料庫和通用語音庫上進行了微調。

模型特點

高性能瑞典語識別
在通用語音庫瑞典語測試集上達到14.3%的詞錯誤率和4.93%的字符錯誤率
多階段訓練
經過預訓練、增量訓練和最終微調三個階段優化
無需語言模型
可直接使用,無需額外語言模型支持

模型能力

瑞典語語音識別
音頻轉文本
語音處理

使用案例

語音轉寫
廣播內容轉錄
將瑞典語廣播節目自動轉寫為文本
語音指令識別
識別瑞典語語音命令
語音輔助技術
無障礙應用
為聽障人士提供即時字幕服務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase