🚀 xtreme_s_xlsr_300m_minds14
该模型是在GOOGLE/XTREME_S - MINDS14.ALL数据集上对facebook/wav2vec2-xls-r-300m进行微调后的版本。它在评估集上取得了以下成绩,为语音识别等相关任务提供了有力支持。
🚀 快速开始
本模型是在特定数据集上微调得到,可直接用于相关语音处理任务。你可以根据自己的需求,结合相应的深度学习框架,使用该模型进行推理或进一步的微调。
✨ 主要特性
- 多语言支持:在多种语言上都有评估结果,如中文、英文、法文、德文等,展现了其在多语言场景下的适用性。
- 指标丰富:提供了准确率、F1值、损失值等多种评估指标,全面反映模型性能。
📚 详细文档
评估集结果
该模型在评估集上的表现如下:
指标 |
详情 |
准确率 |
0.9033 |
准确率(Cs-cz) |
0.9164 |
准确率(De-de) |
0.9477 |
准确率(En-au) |
0.9235 |
准确率(En-gb) |
0.9324 |
准确率(En-us) |
0.9326 |
准确率(Es-es) |
0.9177 |
准确率(Fr-fr) |
0.9444 |
准确率(It-it) |
0.9167 |
准确率(Ko-kr) |
0.8649 |
准确率(Nl-nl) |
0.9450 |
准确率(Pl-pl) |
0.9146 |
准确率(Pt-pt) |
0.8940 |
准确率(Ru-ru) |
0.8667 |
准确率(Zh-cn) |
0.7291 |
F1值 |
0.9015 |
F1值(Cs-cz) |
0.9154 |
F1值(De-de) |
0.9467 |
F1值(En-au) |
0.9199 |
F1值(En-gb) |
0.9334 |
F1值(En-us) |
0.9308 |
F1值(Es-es) |
0.9158 |
F1值(Fr-fr) |
0.9436 |
F1值(It-it) |
0.9135 |
F1值(Ko-kr) |
0.8642 |
F1值(Nl-nl) |
0.9440 |
F1值(Pl-pl) |
0.9159 |
F1值(Pt-pt) |
0.8883 |
F1值(Ru-ru) |
0.8646 |
F1值(Zh-cn) |
0.7249 |
损失值 |
0.4119 |
损失值(Cs-cz) |
0.3790 |
损失值(De-de) |
0.2649 |
损失值(En-au) |
0.3459 |
损失值(En-gb) |
0.2853 |
损失值(En-us) |
0.2203 |
损失值(Es-es) |
0.2731 |
损失值(Fr-fr) |
0.1909 |
损失值(It-it) |
0.3520 |
损失值(Ko-kr) |
0.5431 |
损失值(Nl-nl) |
0.2515 |
损失值(Pl-pl) |
0.4113 |
损失值(Pt-pt) |
0.4798 |
损失值(Ru-ru) |
0.6470 |
损失值(Zh-cn) |
1.1216 |
预测样本数 |
4086 |
训练过程
训练超参数
训练过程中使用了以下超参数:
属性 |
详情 |
学习率 |
0.0003 |
训练批次大小 |
32 |
评估批次大小 |
8 |
随机种子 |
42 |
分布式类型 |
多GPU |
设备数量 |
2 |
总训练批次大小 |
64 |
总评估批次大小 |
16 |
优化器 |
Adam(beta1=0.9,beta2=0.999,epsilon=1e-08) |
学习率调度器类型 |
线性 |
学习率调度器热身步数 |
1500 |
训练轮数 |
50.0 |
混合精度训练 |
原生自动混合精度(Native AMP) |
训练结果
训练损失 |
轮数 |
步数 |
验证损失 |
F1值 |
准确率 |
2.6739 |
5.41 |
200 |
2.5687 |
0.0430 |
0.1190 |
1.4953 |
10.81 |
400 |
1.6052 |
0.5550 |
0.5692 |
0.6177 |
16.22 |
600 |
0.7927 |
0.8052 |
0.8011 |
0.3609 |
21.62 |
800 |
0.5679 |
0.8609 |
0.8609 |
0.4972 |
27.03 |
1000 |
0.5944 |
0.8509 |
0.8523 |
0.1799 |
32.43 |
1200 |
0.6194 |
0.8623 |
0.8621 |
0.1308 |
37.84 |
1400 |
0.5956 |
0.8569 |
0.8548 |
0.2298 |
43.24 |
1600 |
0.5201 |
0.8732 |
0.8743 |
0.0052 |
48.65 |
1800 |
0.3826 |
0.9106 |
0.9103 |
框架版本
- Transformers 4.18.0.dev0
- Pytorch 1.10.2+cu113
- Datasets 2.0.1.dev0
- Tokenizers 0.11.6
📄 许可证
本项目采用Apache-2.0许可证。