N

Nb Wav2vec2 300m Nynorsk

由NbAiLab開發
基於VoxRex特徵提取器微調的300M參數語音識別模型,專為新挪威語(Nynorsk)優化,在NPSC測試集上WER達12.22%
下載量 73.53k
發布時間 : 3/2/2022

模型概述

該模型是針對新挪威語優化的自動語音識別(ASR)系統,採用Wav2Vec2架構,在挪威議會語音語料庫(NPSC)上微調訓練而成。

模型特點

語言模型增強
集成5-gram KenLM語言模型後,詞錯誤率(WER)相對降低20.5%
高效訓練
優化後的參數配置使模型可在普通GPU上3-4天內完成訓練
多模型支持
與團隊開發的Bokmål語系模型形成挪威語ASR解決方案矩陣

模型能力

新挪威語語音轉文本
長音頻片段處理(最長30秒)
低資源語言支持

使用案例

政府服務
議會記錄自動化
將挪威議會會議錄音自動轉錄為文字記錄
測試集字符錯誤率僅4.19%
教育
方言保護
用於新挪威語方言資料的數字化保存
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase