W

Wav2vec2 Xlsr 1b Finnish Lm V2

由Finnish-NLP開發
針對芬蘭語優化的自動語音識別模型,基於Facebook的wav2vec2-xls-r-1b模型微調
下載量 3,869
發布時間 : 3/27/2022

模型概述

這是一個針對芬蘭語自動語音識別(ASR)任務優化的聲學模型,使用275.6小時的芬蘭語標註語音數據微調,幷包含芬蘭語KenLM語言模型用於解碼

模型特點

高性能芬蘭語識別
在Common Voice 7測試集上達到4.09% WER和0.88% CER的優異表現
大規模預訓練基礎
基於在43.6萬小時多語言數據上預訓練的wav2vec2-xls-r-1b模型
集成語言模型
包含專門針對芬蘭語優化的5-gram KenLM語言模型,提升解碼效果
多數據集訓練
融合了Common Voice、芬蘭議會、VoxPopuli等多個芬蘭語語音數據集

模型能力

芬蘭語語音轉文本
短音頻處理(最長20秒)
支持語音識別任務

使用案例

語音轉錄
議會會議記錄
將芬蘭議會會議錄音轉為文字記錄
適合正式場合的芬蘭語語音
語音助手
為芬蘭語語音助手提供ASR能力
對標準芬蘭語有良好識別率
語音分析
語音內容分析
分析芬蘭語廣播或播客內容
適合正式媒體內容的語音識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase