W

Wav2vec2 Xlsr 300m Finnish Lm

由Finnish-NLP開發
基於facebook/wav2vec2-xls-r-300m微調的芬蘭語自動語音識別模型,使用275.6小時芬蘭語標註數據訓練,支持與KenLM語言模型配合使用。
下載量 28.39k
發布時間 : 3/28/2022

模型概述

針對芬蘭語優化的自動語音識別模型,適用於將芬蘭語語音轉換為文本的任務。

模型特點

多源訓練數據
整合了Common Voice、議會錄音、廣播語料等275.6小時芬蘭語數據,覆蓋多種語音場景。
語言模型增強
配套提供基於音頻文本和維基百科訓練的芬蘭語KenLM 5-gram語言模型,提升識別準確率。
高效訓練
採用8-bit Adam優化器和混合精度訓練,在V100 GPU上完成微調。

模型能力

芬蘭語語音識別
長音頻分塊處理
領域自適應(需微調)

使用案例

語音轉寫
議會錄音轉錄
適用於芬蘭議會錄音內容的自動文字轉寫
在議會數據為主的測試集上WER 8.16%
廣播內容字幕生成
為芬蘭語廣播節目自動生成字幕
在廣播語料測試集上CER 1.97%
教育科技
語言學習輔助
用於芬蘭語學習者的發音評估和文本反饋
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase