W

Wav2vec2 Large Voxrex Swedish

由 KBLab 开发
基于VoxRex大型模型微调的瑞典语自动语音识别模型,支持16kHz采样率语音输入
下载量 101.28k
发布时间 : 3/2/2022

模型简介

该模型是专为瑞典语优化的自动语音识别(ASR)系统,基于Facebook的Wav2vec 2.0架构,在瑞典语广播、NST和通用语音数据集上进行了微调。

模型特点

高性能瑞典语识别
在NST+通用语音测试集上达到2.5% WER,在通用语音测试集上达到8.49% WER
支持语言模型增强
使用4-gram语言模型可将WER从8.49%降至7.37%
多数据集训练
结合了瑞典语广播、NST和通用语音数据集进行训练

模型能力

瑞典语语音识别
16kHz音频处理
无语言模型直接使用

使用案例

语音转文字
广播内容转录
将瑞典语广播内容自动转换为文字
在广播数据集上表现优异
语音助手
为瑞典语语音助手提供语音识别能力
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase