W

Wav2vec2 Swedish Common Voice

由birgermoell開發
這是一個基於facebook/wav2vec2-large-xlsr-53模型在瑞典語Common Voice數據集上微調的語音識別模型,訓練數據量為402MB。
下載量 24
發布時間 : 3/2/2022

模型概述

該模型用於瑞典語的自動語音識別(ASR)任務,支持16kHz採樣率的語音輸入。

模型特點

瑞典語優化
專門針對瑞典語進行微調,在Common Voice瑞典語數據集上訓練
基於XLSR模型
基於強大的wav2vec2-large-xlsr-53基礎模型構建
輕量級訓練
僅使用402MB訓練數據進行微調

模型能力

瑞典語語音識別
16kHz音頻處理

使用案例

語音轉文字
瑞典語語音轉錄
將瑞典語語音轉換為文字
在Common Voice測試集上WER為36.91%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase