W

Wav2vec2 Large Xls R 1b Swedish

由 kingabzpro 开发
该模型是基于facebook/wav2vec2-xls-r-1b在Common Voice瑞典语数据集上微调的自动语音识别模型,支持瑞典语语音转文本任务。
下载量 844
发布时间 : 3/2/2022

模型简介

一个针对瑞典语优化的自动语音识别模型,基于wav2vec2-xls-r-1b架构,在Common Voice 8.0数据集上微调,支持高精度瑞典语语音识别。

模型特点

高性能瑞典语识别
在Common Voice瑞典语测试集上达到14.04%的词错误率(WER)和4.86%的字符错误率(CER)
基于大模型微调
基于10亿参数的wav2vec2-xls-r-1b模型微调,具备强大的语音特征提取能力
支持语言模型集成
可结合语言模型进一步提升识别准确率,相比无语言模型降低约4%的WER

模型能力

瑞典语语音识别
语音转文本
长音频处理(支持分块处理)

使用案例

语音转录
瑞典语语音内容转录
将瑞典语语音内容转换为文本格式
在Common Voice测试集上达到14.04% WER
语音助手
瑞典语语音指令识别
用于瑞典语语音助手系统中的指令识别
在鲁棒语音事件数据集上达到29.69% WER
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase