🚀 barthez-orange-ft
这个模型是 moussaKam/barthez-orangesum-abstract 在无特定数据集上的微调版本。它在评估集上取得了以下成果,可用于文本摘要等相关任务。
🚀 快速开始
此模型是 moussaKam/barthez-orangesum-abstract 在无特定数据集上的微调版本。在评估集上达成了如下结果:
- 损失值(Loss):0.1689
- Rouge1:0.6719
- Rouge2:0.6536
- Rougel:0.6719
- Rougelsum:0.6722
- 生成长度(Gen Len):20.0
📚 详细文档
训练过程
训练超参数
训练期间使用了以下超参数:
- 学习率(learning_rate):2e - 05
- 训练批次大小(train_batch_size):16
- 评估批次大小(eval_batch_size):32
- 随机种子(seed):42
- 梯度累积步数(gradient_accumulation_steps):8
- 总训练批次大小(total_train_batch_size):128
- 优化器(optimizer):Adam,β值为(0.9, 0.999),ε值为1e - 08
- 学习率调度器类型(lr_scheduler_type):线性
- 训练轮数(num_epochs):20
训练结果
训练损失 |
轮数 |
步数 |
验证损失 |
Rouge1 |
Rouge2 |
Rougel |
Rougelsum |
生成长度 |
无日志记录 |
1.0 |
31 |
4.6662 |
0.6719 |
0.6535 |
0.6718 |
0.6721 |
20.0 |
无日志记录 |
1.99 |
62 |
0.6939 |
0.6718 |
0.6535 |
0.6718 |
0.6721 |
20.0 |
无日志记录 |
2.99 |
93 |
0.2939 |
0.6718 |
0.6535 |
0.6718 |
0.6721 |
20.0 |
无日志记录 |
3.98 |
124 |
0.2089 |
0.6719 |
0.6535 |
0.6718 |
0.6721 |
20.0 |
无日志记录 |
4.98 |
155 |
0.1880 |
0.6719 |
0.6535 |
0.6718 |
0.6721 |
20.0 |
无日志记录 |
5.98 |
186 |
0.1795 |
0.6719 |
0.6535 |
0.6718 |
0.6721 |
20.0 |
无日志记录 |
6.97 |
217 |
0.1752 |
0.6719 |
0.6535 |
0.6718 |
0.6721 |
20.0 |
无日志记录 |
8.0 |
249 |
0.1732 |
0.6719 |
0.6535 |
0.6718 |
0.6721 |
20.0 |
无日志记录 |
9.0 |
280 |
0.1716 |
0.6719 |
0.6536 |
0.6719 |
0.6722 |
20.0 |
无日志记录 |
9.99 |
311 |
0.1707 |
0.6719 |
0.6536 |
0.6719 |
0.6722 |
20.0 |
无日志记录 |
10.99 |
342 |
0.1704 |
0.6719 |
0.6536 |
0.6719 |
0.6722 |
20.0 |
无日志记录 |
11.98 |
373 |
0.1696 |
0.6719 |
0.6536 |
0.6719 |
0.6722 |
20.0 |
无日志记录 |
12.98 |
404 |
0.1698 |
0.6719 |
0.6536 |
0.6719 |
0.6722 |
20.0 |
无日志记录 |
13.98 |
435 |
0.1695 |
0.6719 |
0.6536 |
0.6719 |
0.6722 |
20.0 |
无日志记录 |
14.97 |
466 |
0.1693 |
0.6719 |
0.6536 |
0.6719 |
0.6722 |
20.0 |
无日志记录 |
16.0 |
498 |
0.1691 |
0.6719 |
0.6536 |
0.6719 |
0.6722 |
20.0 |
0.9743 |
17.0 |
529 |
0.1691 |
0.6719 |
0.6536 |
0.6719 |
0.6722 |
20.0 |
0.9743 |
17.99 |
560 |
0.1690 |
0.6719 |
0.6536 |
0.6719 |
0.6722 |
20.0 |
0.9743 |
18.99 |
591 |
0.1689 |
0.6719 |
0.6536 |
0.6719 |
0.6722 |
20.0 |
0.9743 |
19.92 |
620 |
0.1689 |
0.6719 |
0.6536 |
0.6719 |
0.6722 |
20.0 |
框架版本
- Transformers 4.31.0
- Pytorch 2.1.2
- Datasets 2.18.0
- Tokenizers 0.13.3
📄 许可证
该模型使用的许可证是 Apache - 2.0。
属性 |
详情 |
模型类型 |
基于barthez-orangesum-abstract微调的模型 |
训练数据 |
未指定 |