W

Wav2vec2 Large Voxrex Swedish

由KBLab開發
基於VoxRex大型模型微調的瑞典語自動語音識別模型,支持16kHz採樣率語音輸入
下載量 101.28k
發布時間 : 3/2/2022

模型概述

該模型是專為瑞典語優化的自動語音識別(ASR)系統,基於Facebook的Wav2vec 2.0架構,在瑞典語廣播、NST和通用語音數據集上進行了微調。

模型特點

高性能瑞典語識別
在NST+通用語音測試集上達到2.5% WER,在通用語音測試集上達到8.49% WER
支持語言模型增強
使用4-gram語言模型可將WER從8.49%降至7.37%
多數據集訓練
結合了瑞典語廣播、NST和通用語音數據集進行訓練

模型能力

瑞典語語音識別
16kHz音頻處理
無語言模型直接使用

使用案例

語音轉文字
廣播內容轉錄
將瑞典語廣播內容自動轉換為文字
在廣播數據集上表現優異
語音助手
為瑞典語語音助手提供語音識別能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase