🚀 bart-base-xsum
bart-base-xsum 是基于 facebook/bart-base
在 xsum
数据集上微调的模型,可用于文本摘要任务,在评估集上取得了良好的效果。
🚀 快速开始
此模型是 facebook/bart-base 在 xsum 数据集上的微调版本。它在评估集上取得了以下结果:
- 损失率(Loss):0.8051
- ROUGE-1(R1):0.5643
- ROUGE-2(R2):0.3017
- ROUGE-L(Rl):0.5427
- ROUGE-LSUM(Rlsum):0.5427
模型训练使用了以下仓库中的脚本:https://github.com/MorenoLaQuatra/transformers-tasks-templates
📚 详细文档
训练和评估数据
更多信息待补充。
模型描述
更多信息待补充。
预期用途和限制
更多信息待补充。
🔧 技术细节
训练过程
训练超参数
训练期间使用了以下超参数:
- 学习率(learning_rate):5e-05
- 训练批次大小(train_batch_size):32
- 评估批次大小(eval_batch_size):32
- 随机种子(seed):42
- 优化器(optimizer):Adam,β1 = 0.9,β2 = 0.999,ε = 1e-08
- 学习率调度器类型(lr_scheduler_type):线性
- 学习率调度器热身步数(lr_scheduler_warmup_steps):500
- 训练轮数(num_epochs):10
训练结果
训练损失 |
轮数 |
步数 |
验证损失 |
ROUGE-1 |
ROUGE-2 |
ROUGE-L |
ROUGE-LSUM |
0.8983 |
1.0 |
6377 |
0.8145 |
0.5443 |
0.2724 |
0.5212 |
0.5211 |
0.8211 |
2.0 |
12754 |
0.7940 |
0.5519 |
0.2831 |
0.5295 |
0.5295 |
0.7701 |
3.0 |
19131 |
0.7839 |
0.5569 |
0.2896 |
0.5347 |
0.5348 |
0.7046 |
4.0 |
25508 |
0.7792 |
0.5615 |
0.2956 |
0.5394 |
0.5393 |
0.6837 |
5.0 |
31885 |
0.7806 |
0.5631 |
0.2993 |
0.5416 |
0.5416 |
0.6412 |
6.0 |
38262 |
0.7816 |
0.5643 |
0.301 |
0.5427 |
0.5426 |
0.6113 |
7.0 |
44639 |
0.7881 |
0.5645 |
0.3017 |
0.5428 |
0.5428 |
0.5855 |
8.0 |
51016 |
0.7921 |
0.5651 |
0.303 |
0.5433 |
0.5432 |
0.5636 |
9.0 |
57393 |
0.7972 |
0.5649 |
0.3032 |
0.5433 |
0.5433 |
0.5482 |
10.0 |
63770 |
0.7996 |
0.565 |
0.3036 |
0.5436 |
0.5435 |
框架版本
- Transformers:4.22.1
- Pytorch:1.11.0+cu113
- Datasets:2.0.0
- Tokenizers:0.11.6
📄 许可证
本项目采用 Apache-2.0 许可证。
模型指标详情
任务类型 |
数据集名称 |
数据集分割 |
指标类型 |
指标值 |
指标名称 |
文本摘要 |
xsum |
测试集 |
rouge |
38.6513 |
ROUGE-1 |
文本摘要 |
xsum |
测试集 |
rouge |
17.7585 |
ROUGE-2 |
文本摘要 |
xsum |
测试集 |
rouge |
32.2033 |
ROUGE-L |
文本摘要 |
xsum |
测试集 |
rouge |
32.2064 |
ROUGE-LSUM |
文本摘要 |
xsum |
测试集 |
loss |
1.822434902191162 |
loss |
文本摘要 |
xsum |
测试集 |
gen_len |
19.7028 |
gen_len |
文本摘要 |
xsum |
验证集 |
rouge |
38.7415 |
ROUGE-1 |
文本摘要 |
xsum |
验证集 |
rouge |
17.8295 |
ROUGE-2 |
文本摘要 |
xsum |
验证集 |
rouge |
32.2861 |
ROUGE-L |
文本摘要 |
xsum |
验证集 |
rouge |
32.2763 |
ROUGE-LSUM |
文本摘要 |
xsum |
验证集 |
loss |
1.8132821321487427 |
loss |
文本摘要 |
xsum |
验证集 |
gen_len |
19.7116 |
gen_len |
文本摘要 |
cnn_dailymail |
测试集 |
rouge |
14.9833 |
ROUGE-1 |
文本摘要 |
cnn_dailymail |
测试集 |
rouge |
3.2788 |
ROUGE-2 |
文本摘要 |
cnn_dailymail |
测试集 |
rouge |
11.0507 |
ROUGE-L |
文本摘要 |
cnn_dailymail |
测试集 |
rouge |
13.3138 |
ROUGE-LSUM |
文本摘要 |
cnn_dailymail |
测试集 |
loss |
5.7526116371154785 |
loss |
文本摘要 |
cnn_dailymail |
测试集 |
gen_len |
18.3794 |
gen_len |