W

Wav2vec2 Large Voxpopuli Sv Swedish

由KBLab開發
該模型是基於Facebook的VoxPopuli-sv large模型,額外使用瑞典廣播節目、NST和Common Voice數據進行了預訓練和微調的瑞典語語音識別模型。
下載量 38.78k
發布時間 : 3/2/2022

模型概述

一個針對瑞典語的自動語音識別(ASR)模型,基於Wav2vec 2.0架構,在多種瑞典語數據集上進行了訓練和微調。

模型特點

多數據集訓練
在瑞典本地廣播節目、NST和Common Voice數據集上進行了預訓練和微調
高性能
在NST + Common Voice測試集上WER為3.95%,在Common Voice測試集上WER為10.99%
支持語言模型集成
使用4-gram語言模型可將Common Voice測試集WER從10.99%降至7.82%

模型能力

瑞典語語音識別
16kHz音頻處理

使用案例

語音轉文字
廣播節目轉錄
將瑞典語廣播節目自動轉錄為文字
WER 3.95%(在NST + Common Voice測試集上)
通用語音識別
將瑞典語語音轉換為文字
WER 10.99%(在Common Voice測試集上)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase