W

Wav2vec2 Xlsr 300m Finnish Lm

由aapot開發
基於Facebook wav2vec2-xls-r-300m模型微調的芬蘭語自動語音識別(ASR)模型,使用275.6小時芬蘭語數據訓練,支持與KenLM語言模型配合解碼
下載量 15
發布時間 : 3/2/2022

模型概述

針對芬蘭語優化的語音轉文本模型,適用於芬蘭語語音識別任務

模型特點

多語言預訓練基礎
基於支持128種語言的wav2vec2-xls-r-300m模型微調
語言模型增強
包含專門訓練的芬蘭語KenLM 5-gram語言模型提升識別準確率
高效訓練
使用8-bit Adam優化器和混合精度訓練技術
全面數據覆蓋
訓練數據包含議會記錄、廣播、Common Voice等多來源芬蘭語數據

模型能力

芬蘭語語音識別
長音頻分塊處理
帶語言模型的解碼

使用案例

語音轉錄
議會會議記錄
將芬蘭議會會議音頻轉為文字記錄
對正式演講風格識別效果最佳
廣播內容轉錄
芬蘭語廣播節目的文字轉錄
語音助手
芬蘭語語音指令識別
用於芬蘭語智能設備的語音控制
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase