🚀 XLS-R 300M 法語語音識別模型
本模型是基於自動語音識別技術的模型,在法語語音識別任務上進行了優化。它基於facebook/wav2vec2-xls-r-300m
模型在MOZILLA - FOUNDATION/COMMON_VOICE_8_0 - FR數據集上微調得到,在評估集上取得了較好的效果。
🚀 快速開始
本模型是 facebook/wav2vec2-xls-r-300m 在MOZILLA - FOUNDATION/COMMON_VOICE_8_0 - FR數據集上的微調版本。
它在評估集上取得了以下結果:
- 損失值:0.2388
- 詞錯誤率(WER):0.3681
✨ 主要特性
- 多數據集驗證:在多個數據集上進行了評估,包括Common Voice 8.0 fr、Robust Speech Event - Dev Data和Robust Speech Event - Test Data。
- 低WER:在不同數據集上的詞錯誤率表現良好。
📚 詳細文檔
模型信息
屬性 |
詳情 |
模型類型 |
自動語音識別 |
訓練數據 |
mozilla - foundation/common_voice_8_0 |
評估結果
任務 |
數據集 |
測試WER |
語音識別 |
Common Voice 8.0 fr |
36.81 |
自動語音識別 |
Robust Speech Event - Dev Data |
35.55 |
自動語音識別 |
Robust Speech Event - Test Data |
39.94 |
訓練過程
訓練超參數
以下是訓練過程中使用的超參數:
- 學習率:0.0001
- 訓練批次大小:64
- 評估批次大小:64
- 隨機種子:42
- 優化器:Adam(β1 = 0.9,β2 = 0.999,ε = 1e - 08)
- 學習率調度器類型:線性
- 學習率調度器熱身步數:1500
- 訓練輪數:2.0
- 混合精度訓練:Native AMP
訓練結果
訓練損失 |
輪數 |
步數 |
驗證損失 |
詞錯誤率(WER) |
4.3748 |
0.07 |
500 |
3.8784 |
1.0 |
2.8068 |
0.14 |
1000 |
2.8289 |
0.9826 |
1.6698 |
0.22 |
1500 |
0.8811 |
0.7127 |
1.3488 |
0.29 |
2000 |
0.5166 |
0.5369 |
1.2239 |
0.36 |
2500 |
0.4105 |
0.4741 |
1.1537 |
0.43 |
3000 |
0.3585 |
0.4448 |
1.1184 |
0.51 |
3500 |
0.3336 |
0.4292 |
1.0968 |
0.58 |
4000 |
0.3195 |
0.4180 |
1.0737 |
0.65 |
4500 |
0.3075 |
0.4141 |
1.0677 |
0.72 |
5000 |
0.3015 |
0.4089 |
1.0462 |
0.8 |
5500 |
0.2971 |
0.4077 |
1.0392 |
0.87 |
6000 |
0.2870 |
0.3997 |
1.0178 |
0.94 |
6500 |
0.2805 |
0.3963 |
0.992 |
1.01 |
7000 |
0.2748 |
0.3935 |
1.0197 |
1.09 |
7500 |
0.2691 |
0.3884 |
1.0056 |
1.16 |
8000 |
0.2682 |
0.3889 |
0.9826 |
1.23 |
8500 |
0.2647 |
0.3868 |
0.9815 |
1.3 |
9000 |
0.2603 |
0.3832 |
0.9717 |
1.37 |
9500 |
0.2561 |
0.3807 |
0.9605 |
1.45 |
10000 |
0.2523 |
0.3783 |
0.96 |
1.52 |
10500 |
0.2494 |
0.3788 |
0.9442 |
1.59 |
11000 |
0.2478 |
0.3760 |
0.9564 |
1.66 |
11500 |
0.2454 |
0.3733 |
0.9436 |
1.74 |
12000 |
0.2439 |
0.3747 |
0.938 |
1.81 |
12500 |
0.2411 |
0.3716 |
0.9353 |
1.88 |
13000 |
0.2397 |
0.3698 |
0.9271 |
1.95 |
13500 |
0.2388 |
0.3681 |
框架版本
- Transformers 4.17.0.dev0
- Pytorch 1.10.2 + cu102
- Datasets 1.18.2.dev0
- Tokenizers 0.11.0
📄 許可證
本模型使用Apache - 2.0許可證。