🚀 XLS-R 300M 葡萄牙語語音識別模型
本模型是基於自動語音識別技術的強大工具,它在葡萄牙語語音識別任務上表現出色,通過在特定數據集上的微調,能夠有效處理語音識別相關任務,為語音識別領域提供了可靠的解決方案。
🚀 快速開始
本模型是 facebook/wav2vec2-xls-r-300m 在 MOZILLA - FOUNDATION/COMMON_VOICE_8_0 - PT 數據集上的微調版本。它在評估集上取得了以下結果:
- 損失值:0.2290
- 詞錯誤率(Wer):0.2382
📄 許可證
本模型採用 Apache - 2.0 許可證。
📚 詳細文檔
模型信息
屬性 |
詳情 |
模型類型 |
自動語音識別模型 |
訓練數據 |
mozilla - foundation/common_voice_8_0 葡萄牙語數據集 |
模型評估結果
任務 |
數據集 |
評估指標 |
值 |
語音識別 |
Common Voice 8.0 pt |
測試詞錯誤率(Test WER) |
19.361 |
語音識別 |
Common Voice 8.0 pt |
測試字符錯誤率(Test CER) |
5.533 |
語音識別 |
Robust Speech Event - Dev Data(法語) |
驗證詞錯誤率(Validation WER) |
47.812 |
語音識別 |
Robust Speech Event - Dev Data(法語) |
驗證字符錯誤率(Validation CER) |
18.805 |
自動語音識別 |
Common Voice 8.0 pt |
測試詞錯誤率(Test WER) |
19.36 |
自動語音識別 |
Robust Speech Event - Dev Data(葡萄牙語) |
測試詞錯誤率(Test WER) |
48.01 |
自動語音識別 |
Robust Speech Event - Test Data(葡萄牙語) |
測試詞錯誤率(Test WER) |
49.21 |
訓練過程
訓練超參數
訓練過程中使用了以下超參數:
- 學習率(learning_rate):0.0002
- 訓練批次大小(train_batch_size):32
- 評估批次大小(eval_batch_size):32
- 隨機種子(seed):42
- 優化器(optimizer):Adam(β1 = 0.9,β2 = 0.999,ε = 1e - 08)
- 學習率調度器類型(lr_scheduler_type):線性
- 學習率調度器熱身步數(lr_scheduler_warmup_steps):1500
- 訓練輪數(num_epochs):15.0
- 混合精度訓練(mixed_precision_training):Native AMP
訓練結果
訓練損失 |
輪數 |
步數 |
驗證損失 |
詞錯誤率(Wer) |
3.0952 |
0.64 |
500 |
3.0982 |
1.0 |
1.7975 |
1.29 |
1000 |
0.7887 |
0.5651 |
1.4138 |
1.93 |
1500 |
0.5238 |
0.4389 |
1.344 |
2.57 |
2000 |
0.4775 |
0.4318 |
1.2737 |
3.21 |
2500 |
0.4648 |
0.4075 |
1.2554 |
3.86 |
3000 |
0.4069 |
0.3678 |
1.1996 |
4.5 |
3500 |
0.3914 |
0.3668 |
1.1427 |
5.14 |
4000 |
0.3694 |
0.3572 |
1.1372 |
5.78 |
4500 |
0.3568 |
0.3501 |
1.0831 |
6.43 |
5000 |
0.3331 |
0.3253 |
1.1074 |
7.07 |
5500 |
0.3332 |
0.3352 |
1.0536 |
7.71 |
6000 |
0.3131 |
0.3152 |
1.0248 |
8.35 |
6500 |
0.3024 |
0.3023 |
1.0075 |
9.0 |
7000 |
0.2948 |
0.3028 |
0.979 |
9.64 |
7500 |
0.2796 |
0.2853 |
0.9594 |
10.28 |
8000 |
0.2719 |
0.2789 |
0.9172 |
10.93 |
8500 |
0.2620 |
0.2695 |
0.9047 |
11.57 |
9000 |
0.2537 |
0.2596 |
0.8777 |
12.21 |
9500 |
0.2438 |
0.2525 |
0.8629 |
12.85 |
10000 |
0.2409 |
0.2493 |
0.8575 |
13.5 |
10500 |
0.2366 |
0.2440 |
0.8361 |
14.14 |
11000 |
0.2317 |
0.2385 |
0.8126 |
14.78 |
11500 |
0.2290 |
0.2382 |
框架版本
- Transformers:4.17.0.dev0
- Pytorch:1.10.2 + cu102
- Datasets:1.18.2.dev0
- Tokenizers:0.11.0