N

Nb Wav2vec2 300m Nynorsk

由 NbAiLab 开发
基于VoxRex特征提取器微调的300M参数语音识别模型,专为新挪威语(Nynorsk)优化,在NPSC测试集上WER达12.22%
下载量 73.53k
发布时间 : 3/2/2022

模型简介

该模型是针对新挪威语优化的自动语音识别(ASR)系统,采用Wav2Vec2架构,在挪威议会语音语料库(NPSC)上微调训练而成。

模型特点

语言模型增强
集成5-gram KenLM语言模型后,词错误率(WER)相对降低20.5%
高效训练
优化后的参数配置使模型可在普通GPU上3-4天内完成训练
多模型支持
与团队开发的Bokmål语系模型形成挪威语ASR解决方案矩阵

模型能力

新挪威语语音转文本
长音频片段处理(最长30秒)
低资源语言支持

使用案例

政府服务
议会记录自动化
将挪威议会会议录音自动转录为文字记录
测试集字符错误率仅4.19%
教育
方言保护
用于新挪威语方言资料的数字化保存
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase