🚀 wav2vec2-xlsr-1b-ru
該模型是 facebook/wav2vec2-xls-r-1b 在 common_voice 數據集上的微調版本。它在評估集上取得了以下結果:
- 損失:0.1352
- 詞錯誤率(Wer):0.0971
🚀 快速開始
此模型是語音識別領域的重要成果,基於預訓練模型在特定數據集上微調,可用於俄語的自動語音識別任務。
✨ 主要特性
- 微調模型:基於
facebook/wav2vec2-xls-r-1b
模型在 common_voice
數據集上進行微調。
- 多指標評估:使用詞錯誤率(Wer)和字符錯誤率(Cer)等指標進行評估。
📦 安裝指南
文檔未提供具體安裝步驟,暫不展示。
💻 使用示例
文檔未提供代碼示例,暫不展示。
📚 詳細文檔
模型信息
屬性 |
詳情 |
數據集 |
mozilla-foundation/common_voice_8_0 |
評估指標 |
詞錯誤率(wer)、字符錯誤率(cer) |
標籤 |
音頻、自動語音識別、由訓練器生成、HF 語音識別排行榜、mozilla-foundation/common_voice_8_0、魯棒語音事件、語音 |
模型評估結果
任務 |
數據集 |
測試詞錯誤率(Wer) |
測試字符錯誤率(Cer) |
自動語音識別 |
Common Voice 8 |
10.83 |
2.41 |
自動語音識別 |
Robust Speech Event - Dev Data |
37.71 |
12.98 |
自動語音識別 |
Robust Speech Event - Test Data |
31.89 |
- |
訓練過程
訓練超參數
以下是訓練期間使用的超參數:
- 學習率:5e-05
- 訓練批次大小:32
- 評估批次大小:8
- 隨機種子:42
- 優化器:Adam(β1 = 0.9,β2 = 0.999,ε = 1e-08)
- 學習率調度器類型:線性
- 學習率調度器熱身步數:500
- 訓練輪數:10
- 混合精度訓練:原生自動混合精度(Native AMP)
訓練結果
訓練損失 |
輪數 |
步數 |
驗證損失 |
詞錯誤率(Wer) |
0.5462 |
0.35 |
500 |
0.4027 |
0.3575 |
0.498 |
0.69 |
1000 |
0.2588 |
0.2513 |
0.4279 |
1.04 |
1500 |
0.2265 |
0.2204 |
0.4099 |
1.38 |
2000 |
0.2189 |
0.1979 |
0.4688 |
1.73 |
2500 |
0.2100 |
0.1920 |
0.2241 |
2.07 |
3000 |
0.1980 |
0.1767 |
0.2056 |
2.42 |
3500 |
0.2020 |
0.1683 |
0.3423 |
2.76 |
4000 |
0.1862 |
0.1606 |
0.2478 |
3.11 |
4500 |
0.1787 |
0.1563 |
0.3079 |
3.45 |
5000 |
0.1759 |
0.1555 |
0.2477 |
3.8 |
5500 |
0.1713 |
0.1423 |
0.1718 |
4.14 |
6000 |
0.1695 |
0.1391 |
0.1675 |
4.49 |
6500 |
0.1677 |
0.1372 |
0.1631 |
4.83 |
7000 |
0.1652 |
0.1333 |
0.1429 |
5.18 |
7500 |
0.1605 |
0.1308 |
0.1505 |
5.52 |
8000 |
0.1612 |
0.1245 |
0.1385 |
5.87 |
8500 |
0.1487 |
0.1225 |
0.1285 |
6.22 |
9000 |
0.1526 |
0.1201 |
0.1153 |
6.56 |
9500 |
0.1464 |
0.1172 |
0.1159 |
6.91 |
10000 |
0.1505 |
0.1143 |
0.1061 |
7.25 |
10500 |
0.1444 |
0.1106 |
0.1016 |
7.6 |
11000 |
0.1427 |
0.1075 |
0.1125 |
7.94 |
11500 |
0.1386 |
0.1045 |
0.0937 |
8.29 |
12000 |
0.1403 |
0.1022 |
0.1059 |
8.63 |
12500 |
0.1406 |
0.1022 |
0.0857 |
8.98 |
13000 |
0.1372 |
0.0992 |
0.0901 |
9.32 |
13500 |
0.1380 |
0.0977 |
0.0913 |
9.67 |
14000 |
0.1352 |
0.0971 |
框架版本
- Transformers 4.17.0.dev0
- Pytorch 1.10.2+cu102
- Datasets 1.18.3
- Tokenizers 0.11.0
🔧 技術細節
文檔未提供具體技術細節,暫不展示。
📄 許可證
文檔未提供許可證信息,暫不展示。