W

Wav2vec2 Large Xls R 300m Sl With LM V1

Developed by DrishtiSharma
这是一个基于facebook/wav2vec2-xls-r-300m模型在斯洛文尼亚语(Common Voice 8.0)数据集上微调的自动语音识别(ASR)模型,结合语言模型(LM)提升了识别效果。
Downloads 25
Release Time : 3/2/2022

Model Overview

该模型专门用于斯洛文尼亚语的语音识别任务,在Common Voice 8.0数据集上取得了较好的识别准确率。

Model Features

语言模型增强
结合语言模型(LM)显著提升了识别准确率,WER从20.6%降至13.5%
多数据集验证
在Common Voice和鲁棒语音事件等多个数据集上进行了验证
高效训练
使用混合精度训练和线性学习率调度器优化训练过程

Model Capabilities

斯洛文尼亚语语音识别
长音频处理(支持分块处理)
高准确率字符识别(CER 3.8%)

Use Cases

语音转文字
语音转录
将斯洛文尼亚语语音转换为文字
在Common Voice测试集上WER 13.5%
语音助手
语音指令识别
识别斯洛文尼亚语语音命令
在鲁棒语音事件测试集上WER 46.17%
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase