W

Wav2vec2 Base Fi Voxpopuli V2 Finetuned

由Finnish-NLP開發
基於facebook/wav2vec2-base-fi-voxpopuli-v2微調的芬蘭語自動語音識別模型,使用276.7小時標註數據訓練,支持KenLM語言模型解碼
下載量 64
發布時間 : 5/14/2022

模型概述

針對芬蘭語優化的語音轉文字模型,在Common Voice等測試集上表現優異

模型特點

高效微調
基於VoxPopuli V2預訓練模型,使用276.7小時芬蘭語數據微調
多數據集支持
融合Common Voice、議會會議、廣播語料庫等6種數據源
語言模型增強
配套芬蘭語KenLM 5-gram語言模型提升識別準確率
輕量級部署
支持8-bit Adam優化器,適合資源受限環境

模型能力

芬蘭語語音轉文字
短音頻轉錄(≤20秒)
帶語言模型的語音識別

使用案例

語音轉錄
會議記錄自動化
將芬蘭議會會議錄音轉為文字記錄
在議會數據集上WER 5.93%
語音助手開發
為芬蘭語智能設備提供語音交互基礎
在Common Voice 9.0上CER 1.40%
教育科技
語言學習工具
用於芬蘭語發音評估系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase