🚀 xtreme_s_xlsr_300m_minds14
該模型是在GOOGLE/XTREME_S - MINDS14.ALL數據集上對facebook/wav2vec2-xls-r-300m進行微調後的版本。它在評估集上取得了以下成績,為語音識別等相關任務提供了有力支持。
🚀 快速開始
本模型是在特定數據集上微調得到,可直接用於相關語音處理任務。你可以根據自己的需求,結合相應的深度學習框架,使用該模型進行推理或進一步的微調。
✨ 主要特性
- 多語言支持:在多種語言上都有評估結果,如中文、英文、法文、德文等,展現了其在多語言場景下的適用性。
- 指標豐富:提供了準確率、F1值、損失值等多種評估指標,全面反映模型性能。
📚 詳細文檔
評估集結果
該模型在評估集上的表現如下:
指標 |
詳情 |
準確率 |
0.9033 |
準確率(Cs-cz) |
0.9164 |
準確率(De-de) |
0.9477 |
準確率(En-au) |
0.9235 |
準確率(En-gb) |
0.9324 |
準確率(En-us) |
0.9326 |
準確率(Es-es) |
0.9177 |
準確率(Fr-fr) |
0.9444 |
準確率(It-it) |
0.9167 |
準確率(Ko-kr) |
0.8649 |
準確率(Nl-nl) |
0.9450 |
準確率(Pl-pl) |
0.9146 |
準確率(Pt-pt) |
0.8940 |
準確率(Ru-ru) |
0.8667 |
準確率(Zh-cn) |
0.7291 |
F1值 |
0.9015 |
F1值(Cs-cz) |
0.9154 |
F1值(De-de) |
0.9467 |
F1值(En-au) |
0.9199 |
F1值(En-gb) |
0.9334 |
F1值(En-us) |
0.9308 |
F1值(Es-es) |
0.9158 |
F1值(Fr-fr) |
0.9436 |
F1值(It-it) |
0.9135 |
F1值(Ko-kr) |
0.8642 |
F1值(Nl-nl) |
0.9440 |
F1值(Pl-pl) |
0.9159 |
F1值(Pt-pt) |
0.8883 |
F1值(Ru-ru) |
0.8646 |
F1值(Zh-cn) |
0.7249 |
損失值 |
0.4119 |
損失值(Cs-cz) |
0.3790 |
損失值(De-de) |
0.2649 |
損失值(En-au) |
0.3459 |
損失值(En-gb) |
0.2853 |
損失值(En-us) |
0.2203 |
損失值(Es-es) |
0.2731 |
損失值(Fr-fr) |
0.1909 |
損失值(It-it) |
0.3520 |
損失值(Ko-kr) |
0.5431 |
損失值(Nl-nl) |
0.2515 |
損失值(Pl-pl) |
0.4113 |
損失值(Pt-pt) |
0.4798 |
損失值(Ru-ru) |
0.6470 |
損失值(Zh-cn) |
1.1216 |
預測樣本數 |
4086 |
訓練過程
訓練超參數
訓練過程中使用了以下超參數:
屬性 |
詳情 |
學習率 |
0.0003 |
訓練批次大小 |
32 |
評估批次大小 |
8 |
隨機種子 |
42 |
分佈式類型 |
多GPU |
設備數量 |
2 |
總訓練批次大小 |
64 |
總評估批次大小 |
16 |
優化器 |
Adam(beta1=0.9,beta2=0.999,epsilon=1e-08) |
學習率調度器類型 |
線性 |
學習率調度器熱身步數 |
1500 |
訓練輪數 |
50.0 |
混合精度訓練 |
原生自動混合精度(Native AMP) |
訓練結果
訓練損失 |
輪數 |
步數 |
驗證損失 |
F1值 |
準確率 |
2.6739 |
5.41 |
200 |
2.5687 |
0.0430 |
0.1190 |
1.4953 |
10.81 |
400 |
1.6052 |
0.5550 |
0.5692 |
0.6177 |
16.22 |
600 |
0.7927 |
0.8052 |
0.8011 |
0.3609 |
21.62 |
800 |
0.5679 |
0.8609 |
0.8609 |
0.4972 |
27.03 |
1000 |
0.5944 |
0.8509 |
0.8523 |
0.1799 |
32.43 |
1200 |
0.6194 |
0.8623 |
0.8621 |
0.1308 |
37.84 |
1400 |
0.5956 |
0.8569 |
0.8548 |
0.2298 |
43.24 |
1600 |
0.5201 |
0.8732 |
0.8743 |
0.0052 |
48.65 |
1800 |
0.3826 |
0.9106 |
0.9103 |
框架版本
- Transformers 4.18.0.dev0
- Pytorch 1.10.2+cu113
- Datasets 2.0.1.dev0
- Tokenizers 0.11.6
📄 許可證
本項目採用Apache-2.0許可證。