🚀 wav2vec2-large-xls-r-300m-sl-with-LM-v2
本模型是基于自动语音识别技术的模型,在MOZILLA - FOUNDATION/COMMON_VOICE_8_0 - SL数据集上微调,能有效实现语音识别功能,并在相关评估集上取得了良好的指标成绩。
🚀 快速开始
本模型是 facebook/wav2vec2-xls-r-300m 在MOZILLA - FOUNDATION/COMMON_VOICE_8_0 - SL数据集上的微调版本。它在评估集上取得了以下结果:
- 损失值:0.2855
- 字错率(Wer):0.2401
评估命令
- 在
mozilla - foundation/common_voice_8_0
测试集上进行评估
python eval.py --model_id DrishtiSharma/wav2vec2-large-xls-r-300m-sl-with-LM-v2 --dataset mozilla-foundation/common_voice_8_0 --config sl --split test --log_outputs
- 在
speech - recognition - community - v2/dev_data
数据集上进行评估
python eval.py --model_id DrishtiSharma/wav2vec2-large-xls-r-300m-sl-with-LM-v2 --dataset speech-recognition-community-v2/dev_data --config sl --split validation --chunk_length_s 10 --stride_length_s 1
✨ 主要特性
模型指标
属性 |
详情 |
模型名称 |
wav2vec2-large-xls-r-300m-sl-with-LM-v2 |
支持语言 |
斯洛文尼亚语(sl) |
许可证 |
Apache - 2.0 |
适用任务 |
自动语音识别 |
训练数据集 |
mozilla - foundation/common_voice_8_0 |
测试集字错率(Test WER) |
0.21695212999560826 |
测试集字符错误率(Test CER) |
0.052850080572474256 |
测试集字错率(+LM) |
0.14551310203484116 |
测试集字符错误率(+LM) |
0.03927566711277415 |
开发集字错率(Dev WER) |
0.560722380639029 |
开发集字符错误率(Dev CER) |
0.2279626093074681 |
开发集字错率(+LM) |
0.46486802661402354 |
开发集字符错误率(+LM) |
0.21105136194592422 |
🔧 技术细节
训练超参数
以下是训练过程中使用的超参数:
- 学习率:7e - 05
- 训练批次大小:32
- 评估批次大小:32
- 随机种子:42
- 优化器:Adam(β1 = 0.9,β2 = 0.999,ε = 1e - 08)
- 学习率调度器类型:线性
- 学习率调度器热身步数:1000
- 训练轮数:100.0
- 混合精度训练:Native AMP
训练结果
训练损失 |
轮数 |
步数 |
验证损失 |
字错率(Wer) |
6.9294 |
6.1 |
500 |
2.9712 |
1.0 |
2.8305 |
12.2 |
1000 |
1.7073 |
0.9479 |
1.4795 |
18.29 |
1500 |
0.5756 |
0.6397 |
1.3433 |
24.39 |
2000 |
0.4968 |
0.5424 |
1.1766 |
30.49 |
2500 |
0.4185 |
0.4743 |
1.0017 |
36.59 |
3000 |
0.3303 |
0.3578 |
0.9358 |
42.68 |
3500 |
0.3003 |
0.3051 |
0.8358 |
48.78 |
4000 |
0.3045 |
0.2884 |
0.7647 |
54.88 |
4500 |
0.2866 |
0.2677 |
0.7482 |
60.98 |
5000 |
0.2829 |
0.2585 |
0.6943 |
67.07 |
5500 |
0.2782 |
0.2478 |
0.6586 |
73.17 |
6000 |
0.2911 |
0.2537 |
0.6425 |
79.27 |
6500 |
0.2817 |
0.2462 |
0.6067 |
85.37 |
7000 |
0.2910 |
0.2436 |
0.5974 |
91.46 |
7500 |
0.2875 |
0.2430 |
0.5812 |
97.56 |
8000 |
0.2852 |
0.2396 |
框架版本
- Transformers:4.17.0.dev0
- Pytorch:1.10.2 + cu102
- Datasets:1.18.2.dev0
- Tokenizers:0.11.0
📄 许可证
本模型使用的许可证为Apache - 2.0。