N

Nb Wav2vec2 1b Bokmaal

由NbAiLab開發
基於Facebook/Meta的XLS-R特徵提取器微調的挪威語自動語音識別模型,在NPSC測試集上詞錯誤率6.33%
下載量 23.95k
發布時間 : 3/2/2022

模型概述

針對書面挪威語優化的自動語音識別模型,基於1B參數的XLS-R架構微調,支持16KHz音頻輸入

模型特點

高性能識別
在NPSC測試集上達到6.33%詞錯誤率(使用語言模型)
語言模型集成
支持5-gram KenLM語言模型增強,顯著提升識別準確率
計算效率優化
普通GPU可在3-4天內完成完整訓練,提供多種參數優化方案

模型能力

挪威語語音轉文本
16KHz音頻處理
長音頻分段處理(最長30秒)

使用案例

語音轉錄
議會會議記錄
自動轉錄挪威議會會議音頻
相比基線模型WER從17.10%提升至5.81%
語音助手
挪威語語音指令識別
為挪威語智能設備提供語音交互支持
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase