🚀 XLS-R-EUS模型
该模型是基于语音识别技术的微调模型,在MOZILLA - FOUNDATION/COMMON_VOICE_8_0 - EU数据集上对[facebook/wav2vec2 - xls - r - 300m](https://huggingface.co/facebook/wav2vec2 - xls - r - 300m)进行微调,在评估集上取得了良好的识别效果。
🚀 快速开始
此模型是[facebook/wav2vec2 - xls - r - 300m](https://huggingface.co/facebook/wav2vec2 - xls - r - 300m)在MOZILLA - FOUNDATION/COMMON_VOICE_8_0 - EU数据集上的微调版本。它在评估集上取得了以下结果:
- 损失值:0.2278
- 词错误率(Wer):0.1787
✨ 主要特性
属性 |
详情 |
模型类型 |
自动语音识别模型 |
训练数据 |
mozilla - foundation/common_voice_8_0 |
标签 |
automatic - speech - recognition、mozilla - foundation/common_voice_8_0、generated_from_trainer、robust - speech - event、et、hf - asr - leaderboard |
🔧 技术细节
训练超参数
训练过程中使用了以下超参数:
- 学习率:0.0003
- 训练批次大小:72
- 评估批次大小:72
- 随机种子:42
- 梯度累积步数:2
- 总训练批次大小:144
- 优化器:Adam(β1 = 0.9,β2 = 0.999,ε = 1e - 08)
- 学习率调度器类型:余弦调度器
- 学习率调度器热身步数:500
- 训练轮数:100.0
- 混合精度训练:Native AMP
训练结果
训练损失 |
轮数 |
步数 |
验证损失 |
词错误率(Wer) |
0.2548 |
4.24 |
500 |
0.2470 |
0.3663 |
0.1435 |
8.47 |
1000 |
0.2000 |
0.2791 |
0.1158 |
12.71 |
1500 |
0.2030 |
0.2652 |
0.1094 |
16.95 |
2000 |
0.2096 |
0.2605 |
0.1004 |
21.19 |
2500 |
0.2150 |
0.2477 |
0.0945 |
25.42 |
3000 |
0.2072 |
0.2369 |
0.0844 |
29.66 |
3500 |
0.1981 |
0.2328 |
0.0877 |
33.89 |
4000 |
0.2041 |
0.2425 |
0.0741 |
38.14 |
4500 |
0.2353 |
0.2421 |
0.0676 |
42.37 |
5000 |
0.2092 |
0.2213 |
0.0623 |
46.61 |
5500 |
0.2217 |
0.2250 |
0.0574 |
50.84 |
6000 |
0.2152 |
0.2179 |
0.0583 |
55.08 |
6500 |
0.2207 |
0.2186 |
0.0488 |
59.32 |
7000 |
0.2225 |
0.2159 |
0.0456 |
63.56 |
7500 |
0.2293 |
0.2031 |
0.041 |
67.79 |
8000 |
0.2277 |
0.2013 |
0.0379 |
72.03 |
8500 |
0.2287 |
0.1991 |
0.0381 |
76.27 |
9000 |
0.2233 |
0.1954 |
0.0308 |
80.51 |
9500 |
0.2195 |
0.1835 |
0.0291 |
84.74 |
10000 |
0.2266 |
0.1825 |
0.0266 |
88.98 |
10500 |
0.2285 |
0.1801 |
0.0266 |
93.22 |
11000 |
0.2292 |
0.1801 |
0.0262 |
97.46 |
11500 |
0.2278 |
0.1788 |
框架版本
- Transformers 4.16.0.dev0
- Pytorch 1.10.1 + cu102
- Datasets 1.18.4.dev0
- Tokenizers 0.11.0
📄 许可证
本模型使用Apache 2.0许可证。