🚀 whisper-large-v2-mn-13
該模型是 openai/whisper-large-v2 在特定數據集上的微調版本。它在評估集上取得了以下結果:
- 損失:0.1689
- 詞錯誤率(Wer):20.0240
- 字符錯誤率(Cer):6.6010
📚 詳細文檔
模型標籤
- whisper-event
- hf-asr-leaderboard
- generated_from_multiple_datasets
訓練數據集
- mozilla-foundation/common_voice_11_0
- google/fleurs
- bayartsogt/ulaanbal-v0
- bayartsogt/youtube-mongolian-v1
評估指標
模型索引
模型名稱 |
任務類型 |
數據集名稱 |
數據集類型 |
數據集配置 |
數據集劃分 |
詞錯誤率(Wer) |
字符錯誤率(Cer) |
whisper-large-v2-mn-13 |
自動語音識別 |
Common Voice 11.0 |
mozilla-foundation/common_voice_11_0 |
mn |
test |
20.02403320952589 |
6.601024224251205 |
訓練過程
訓練超參數
- 學習率:1e-05
- 訓練批次大小:8
- 評估批次大小:4
- 隨機種子:42
- 優化器:Adam(β1=0.9,β2=0.999,ε=1e-08)
- 學習率調度器類型:線性
- 學習率調度器熱身步數:500
- 訓練步數:25000
- 混合精度訓練:原生自動混合精度(Native AMP)
訓練結果
訓練損失 |
輪數 |
步數 |
字符錯誤率(Cer) |
驗證損失 |
詞錯誤率(Wer) |
0.3921 |
0.09 |
1000 |
15.7845 |
0.4101 |
46.9030 |
0.3115 |
0.17 |
2000 |
14.2911 |
0.3353 |
41.8451 |
0.2659 |
0.26 |
3000 |
11.8131 |
0.2800 |
34.6406 |
0.2477 |
0.35 |
4000 |
10.6659 |
0.2578 |
32.0024 |
0.2274 |
0.43 |
5000 |
10.0460 |
0.2463 |
30.3419 |
0.2059 |
0.52 |
6000 |
9.9264 |
0.2305 |
28.5558 |
0.2092 |
0.61 |
7000 |
9.4277 |
0.2196 |
27.8785 |
0.1956 |
0.69 |
8000 |
9.2745 |
0.2093 |
26.8353 |
0.195 |
0.78 |
9000 |
8.9485 |
0.2042 |
26.6168 |
0.195 |
0.87 |
10000 |
8.5324 |
0.2001 |
25.6718 |
0.1795 |
0.95 |
11000 |
8.1786 |
0.1936 |
24.1698 |
0.1575 |
1.04 |
12000 |
7.8653 |
0.1915 |
23.8912 |
0.1358 |
1.13 |
13000 |
7.6749 |
0.1918 |
23.3778 |
0.1509 |
1.21 |
14000 |
7.7221 |
0.1852 |
23.1811 |
0.1474 |
1.3 |
15000 |
7.3246 |
0.1764 |
22.4984 |
0.1461 |
1.39 |
16000 |
7.3187 |
0.1793 |
22.4110 |
0.134 |
1.47 |
17000 |
7.1123 |
0.1737 |
21.9412 |
0.1289 |
1.56 |
18000 |
7.4593 |
0.1727 |
22.0614 |
0.1287 |
1.65 |
19000 |
7.0230 |
0.1701 |
21.4223 |
0.1196 |
1.73 |
20000 |
6.9447 |
0.1666 |
21.2475 |
0.1275 |
1.82 |
21000 |
6.7956 |
0.1653 |
20.8106 |
0.1329 |
1.91 |
22000 |
6.7729 |
0.1622 |
20.3354 |
0.1294 |
1.99 |
23000 |
6.6448 |
0.1606 |
20.2207 |
0.1043 |
2.08 |
24000 |
6.6010 |
0.1689 |
20.0240 |
0.079 |
2.17 |
25000 |
6.6246 |
0.1687 |
20.1005 |
框架版本
- Transformers 4.26.0.dev0
- Pytorch 1.13.1+cu117
- Datasets 2.8.1.dev0
- Tokenizers 0.13.2
📄 許可證
本模型採用 Apache 2.0 許可證。