W

Wav2vec2 Xlsr 1b Finnish Lm

由Finnish-NLP開發
基於facebook/wav2vec2-xls-r-1b微調的芬蘭語自動語音識別模型,使用259.57小時芬蘭語標註語音數據訓練,支持芬蘭語語音轉文本任務。
下載量 32
發布時間 : 3/28/2022

模型概述

這是一個針對芬蘭語優化的自動語音識別模型,基於10億參數的Wav2Vec2 XLS-R架構微調,適用於短音頻轉錄。包含配套的芬蘭語KenLM語言模型以提升解碼效果。

模型特點

大規模預訓練基礎
基於43.6萬小時多語言語音預訓練的XLS-R架構,具有強大的聲學特徵提取能力
領域適配微調
使用259小時芬蘭語數據微調,特別優化議會演講和廣播語音場景
語言模型增強
配套5-gram KenLM語言模型,顯著提升轉錄準確率
高效推理
支持20秒短音頻直接處理,長音頻可通過分塊方法處理

模型能力

芬蘭語語音識別
短音頻轉錄
帶語言模型的解碼

使用案例

語音轉錄
議會會議記錄
轉錄芬蘭議會演講內容
在阿爾託議會數據集上表現優異
廣播內容轉寫
處理芬蘭廣播電臺節目音頻
在廣播語料庫上WER 5.65%
教育應用
語言學習輔助
幫助學習者糾正芬蘭語發音
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase