N

Nb Wav2vec2 1b Bokmaal

由 NbAiLab 开发
基于Facebook/Meta的XLS-R特征提取器微调的挪威语自动语音识别模型,在NPSC测试集上词错误率6.33%
下载量 23.95k
发布时间 : 3/2/2022

模型简介

针对书面挪威语优化的自动语音识别模型,基于1B参数的XLS-R架构微调,支持16KHz音频输入

模型特点

高性能识别
在NPSC测试集上达到6.33%词错误率(使用语言模型)
语言模型集成
支持5-gram KenLM语言模型增强,显著提升识别准确率
计算效率优化
普通GPU可在3-4天内完成完整训练,提供多种参数优化方案

模型能力

挪威语语音转文本
16KHz音频处理
长音频分段处理(最长30秒)

使用案例

语音转录
议会会议记录
自动转录挪威议会会议音频
相比基线模型WER从17.10%提升至5.81%
语音助手
挪威语语音指令识别
为挪威语智能设备提供语音交互支持
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase