W

Wav2vec2 Large Xlsr 53 Swedish

由 KBLab 开发
基于facebook/wav2vec2-large-xlsr-53框架微调的瑞典语自动语音识别模型,支持16kHz采样率的语音输入
下载量 30.51k
发布时间 : 3/2/2022

模型简介

这是一个专门针对瑞典语优化的自动语音识别(ASR)模型,基于大规模XLSR-53架构,在瑞典NST听写语料库和通用语音库上进行了微调。

模型特点

高性能瑞典语识别
在通用语音库瑞典语测试集上达到14.3%的词错误率和4.93%的字符错误率
多阶段训练
经过预训练、增量训练和最终微调三个阶段优化
无需语言模型
可直接使用,无需额外语言模型支持

模型能力

瑞典语语音识别
音频转文本
语音处理

使用案例

语音转写
广播内容转录
将瑞典语广播节目自动转写为文本
语音指令识别
识别瑞典语语音命令
语音辅助技术
无障碍应用
为听障人士提供实时字幕服务
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase