🚀 hello_2b
hello_2b 是一個基於自動語音識別技術的模型,它在 COMMON_VOICE - TR 數據集上對 facebook/wav2vec2-xls-r-2b 進行了微調,在評估集上取得了不錯的效果。
🚀 快速開始
本模型是 facebook/wav2vec2-xls-r-2b 在 COMMON_VOICE - TR 數據集上的微調版本。它在評估集上取得了以下結果:
- 損失值(Loss):1.2725
- 字錯率(Wer):0.9531
🔧 技術細節
訓練超參數
訓練過程中使用了以下超參數:
- 學習率(learning_rate):1e - 05
- 訓練批次大小(train_batch_size):2
- 評估批次大小(eval_batch_size):8
- 隨機種子(seed):42
- 分佈式類型(distributed_type):多 GPU
- 設備數量(num_devices):2
- 梯度累積步數(gradient_accumulation_steps):8
- 總訓練批次大小(total_train_batch_size):32
- 總評估批次大小(total_eval_batch_size):16
- 優化器(optimizer):Adam,β1 = 0.9,β2 = 0.999,ε = 1e - 08
- 學習率調度器類型(lr_scheduler_type):線性
- 學習率調度器熱身步數(lr_scheduler_warmup_steps):500
- 訓練輪數(num_epochs):30.0
- 混合精度訓練(mixed_precision_training):原生自動混合精度(Native AMP)
訓練結果
訓練損失 |
輪數 |
步數 |
驗證損失 |
字錯率 |
3.1646 |
0.92 |
100 |
3.2106 |
1.0 |
0.368 |
1.85 |
200 |
2.9963 |
1.0 |
0.2252 |
2.77 |
300 |
2.8078 |
0.9999 |
0.1546 |
3.7 |
400 |
2.3458 |
0.9996 |
0.1468 |
4.63 |
500 |
2.0086 |
0.9986 |
0.1261 |
5.55 |
600 |
1.8269 |
0.9985 |
0.1206 |
6.48 |
700 |
1.7347 |
0.9956 |
0.1959 |
7.4 |
800 |
1.6819 |
0.9955 |
0.0502 |
8.33 |
900 |
1.6809 |
0.9965 |
0.0811 |
9.26 |
1000 |
1.6674 |
0.9916 |
0.0534 |
10.18 |
1100 |
1.5719 |
0.9898 |
0.0402 |
11.11 |
1200 |
1.4620 |
0.9821 |
0.057 |
12.04 |
1300 |
1.3015 |
0.9554 |
0.0385 |
12.96 |
1400 |
1.3798 |
0.9600 |
0.0422 |
13.88 |
1500 |
1.3538 |
0.9699 |
0.014 |
14.81 |
1600 |
1.2507 |
0.9443 |
0.0232 |
15.74 |
1700 |
1.3318 |
0.9465 |
0.0554 |
16.66 |
1800 |
1.2784 |
0.9462 |
0.0316 |
17.59 |
1900 |
1.2503 |
0.9481 |
0.0524 |
18.51 |
2000 |
1.3920 |
0.9604 |
0.0142 |
19.44 |
2100 |
1.4224 |
0.9698 |
0.0288 |
20.37 |
2200 |
1.3475 |
0.9635 |
0.0106 |
21.29 |
2300 |
1.2232 |
0.9264 |
0.0396 |
22.22 |
2400 |
1.3323 |
0.9615 |
0.0349 |
23.15 |
2500 |
1.2741 |
0.9587 |
0.0121 |
24.07 |
2600 |
1.2671 |
0.9586 |
0.0224 |
24.99 |
2700 |
1.3001 |
0.9611 |
0.0449 |
25.92 |
2800 |
1.2777 |
0.9572 |
0.0186 |
26.85 |
2900 |
1.2766 |
0.9607 |
0.0365 |
27.77 |
3000 |
1.2935 |
0.9598 |
0.0105 |
28.7 |
3100 |
1.2761 |
0.9588 |
0.021 |
29.63 |
3200 |
1.2686 |
0.9528 |
框架版本
- Transformers:4.13.0.dev0
- Pytorch:1.10.0
- Datasets:1.15.2.dev0
- Tokenizers:0.10.3
📄 許可證
文檔中未提及許可證相關信息。
📋 模型信息表格