🚀 wav2vec2-large-xls-r-300m-sl-with-LM-v2
本模型是基於自動語音識別技術的模型,在MOZILLA - FOUNDATION/COMMON_VOICE_8_0 - SL數據集上微調,能有效實現語音識別功能,並在相關評估集上取得了良好的指標成績。
🚀 快速開始
本模型是 facebook/wav2vec2-xls-r-300m 在MOZILLA - FOUNDATION/COMMON_VOICE_8_0 - SL數據集上的微調版本。它在評估集上取得了以下結果:
- 損失值:0.2855
- 字錯率(Wer):0.2401
評估命令
- 在
mozilla - foundation/common_voice_8_0
測試集上進行評估
python eval.py --model_id DrishtiSharma/wav2vec2-large-xls-r-300m-sl-with-LM-v2 --dataset mozilla-foundation/common_voice_8_0 --config sl --split test --log_outputs
- 在
speech - recognition - community - v2/dev_data
數據集上進行評估
python eval.py --model_id DrishtiSharma/wav2vec2-large-xls-r-300m-sl-with-LM-v2 --dataset speech-recognition-community-v2/dev_data --config sl --split validation --chunk_length_s 10 --stride_length_s 1
✨ 主要特性
模型指標
屬性 |
詳情 |
模型名稱 |
wav2vec2-large-xls-r-300m-sl-with-LM-v2 |
支持語言 |
斯洛文尼亞語(sl) |
許可證 |
Apache - 2.0 |
適用任務 |
自動語音識別 |
訓練數據集 |
mozilla - foundation/common_voice_8_0 |
測試集字錯率(Test WER) |
0.21695212999560826 |
測試集字符錯誤率(Test CER) |
0.052850080572474256 |
測試集字錯率(+LM) |
0.14551310203484116 |
測試集字符錯誤率(+LM) |
0.03927566711277415 |
開發集字錯率(Dev WER) |
0.560722380639029 |
開發集字符錯誤率(Dev CER) |
0.2279626093074681 |
開發集字錯率(+LM) |
0.46486802661402354 |
開發集字符錯誤率(+LM) |
0.21105136194592422 |
🔧 技術細節
訓練超參數
以下是訓練過程中使用的超參數:
- 學習率:7e - 05
- 訓練批次大小:32
- 評估批次大小:32
- 隨機種子:42
- 優化器:Adam(β1 = 0.9,β2 = 0.999,ε = 1e - 08)
- 學習率調度器類型:線性
- 學習率調度器熱身步數:1000
- 訓練輪數:100.0
- 混合精度訓練:Native AMP
訓練結果
訓練損失 |
輪數 |
步數 |
驗證損失 |
字錯率(Wer) |
6.9294 |
6.1 |
500 |
2.9712 |
1.0 |
2.8305 |
12.2 |
1000 |
1.7073 |
0.9479 |
1.4795 |
18.29 |
1500 |
0.5756 |
0.6397 |
1.3433 |
24.39 |
2000 |
0.4968 |
0.5424 |
1.1766 |
30.49 |
2500 |
0.4185 |
0.4743 |
1.0017 |
36.59 |
3000 |
0.3303 |
0.3578 |
0.9358 |
42.68 |
3500 |
0.3003 |
0.3051 |
0.8358 |
48.78 |
4000 |
0.3045 |
0.2884 |
0.7647 |
54.88 |
4500 |
0.2866 |
0.2677 |
0.7482 |
60.98 |
5000 |
0.2829 |
0.2585 |
0.6943 |
67.07 |
5500 |
0.2782 |
0.2478 |
0.6586 |
73.17 |
6000 |
0.2911 |
0.2537 |
0.6425 |
79.27 |
6500 |
0.2817 |
0.2462 |
0.6067 |
85.37 |
7000 |
0.2910 |
0.2436 |
0.5974 |
91.46 |
7500 |
0.2875 |
0.2430 |
0.5812 |
97.56 |
8000 |
0.2852 |
0.2396 |
框架版本
- Transformers:4.17.0.dev0
- Pytorch:1.10.2 + cu102
- Datasets:1.18.2.dev0
- Tokenizers:0.11.0
📄 許可證
本模型使用的許可證為Apache - 2.0。