🚀 sammy786/wav2vec2-xlsr-czech
这个模型是 facebook/wav2vec2-xls-r-1b 在 MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - cs 数据集上的微调版本。它在评估集(训练数据集的 10% 与其他和开发数据集合并)上取得了以下结果:
✨ 主要特性
- 基于预训练模型
facebook/wav2vec2-xls-r-1b
进行微调,适用于捷克语的自动语音识别任务。
- 在多个数据集上进行评估,展示了不同场景下的性能指标。
📦 安装指南
文档未提供安装步骤,跳过此章节。
💻 使用示例
文档未提供代码示例,跳过此章节。
📚 详细文档
模型描述
对 "facebook/wav2vec2-xls-r-1b" 进行了微调。
预期用途与限制
需要更多信息。
训练和评估数据
训练数据 - 通用语音芬兰语的 train.tsv、dev.tsv、invalidated.tsv 和 other.tsv 文件。
训练过程
为创建训练数据集,将所有可能的数据集进行合并,并采用 90 - 10 的分割方式。
训练超参数
训练期间使用了以下超参数:
- 学习率:0.000045637994662983496
- 训练批次大小:8
- 评估批次大小:16
- 随机种子:13
- 梯度累积步数:4
- 总训练批次大小:32
- 优化器:Adam,β=(0.9, 0.999),ε=1e - 08
- 学习率调度器类型:带重启的余弦调度器
- 学习率调度器热身步数:500
- 训练轮数:7
- 混合精度训练:原生自动混合精度(Native AMP)
训练结果
步骤 |
训练损失 |
验证损失 |
字错率(Wer) |
200 |
6.654600 |
3.329486 |
1.000000 |
400 |
1.700600 |
0.317266 |
0.409446 |
600 |
0.767400 |
0.211371 |
0.313981 |
800 |
0.718600 |
0.167771 |
0.280676 |
1000 |
0.661700 |
0.142229 |
0.258938 |
1200 |
0.594400 |
0.137321 |
0.256275 |
1400 |
0.583900 |
0.132922 |
0.248418 |
1600 |
0.565100 |
0.117214 |
0.238640 |
1800 |
0.369600 |
0.116954 |
0.238291 |
2000 |
0.292800 |
0.109973 |
0.227509 |
2200 |
0.255400 |
0.104955 |
0.228120 |
2400 |
0.266800 |
0.097268 |
0.220525 |
2600 |
0.232700 |
0.096055 |
0.213584 |
2800 |
0.213700 |
0.097770 |
0.218866 |
3000 |
0.209900 |
0.091633 |
0.210485 |
3200 |
0.196800 |
0.090342 |
0.208739 |
3400 |
0.200500 |
0.082326 |
0.204767 |
3600 |
0.176800 |
0.085491 |
0.204068 |
3800 |
0.170000 |
0.081289 |
0.201231 |
4000 |
0.166200 |
0.080762 |
0.200227 |
4200 |
0.161700 |
0.076671 |
0.198001 |
4400 |
0.147000 |
0.077383 |
0.196997 |
4600 |
0.141900 |
0.076057 |
0.195862 |
4800 |
0.144800 |
0.074612 |
0.195120 |
5000 |
0.138900 |
0.073138 |
0.193985 |
5200 |
0.143900 |
0.072802 |
0.192894 |
5400 |
0.131100 |
0.072764 |
0.193723 |
5600 |
0.137000 |
0.072697 |
0.193679 |
5800 |
0.133300 |
0.072651 |
0.193286 |
框架版本
- Transformers 4.16.0.dev0
- Pytorch 1.10.0+cu102
- Datasets 1.17.1.dev0
- Tokenizers 0.10.3
评估命令
- 在
mozilla-foundation/common_voice_8_0
数据集的 test
分割上进行评估
python eval.py --model_id sammy786/wav2vec2-xlsr-czech --dataset mozilla-foundation/common_voice_8_0 --config cs --split test
🔧 技术细节
文档未提供足够详细的技术实现细节(具体技术说明少于 50 字),跳过此章节。
📄 许可证
本项目采用 Apache 2.0 许可证。