🚀 bart-base-xsum
bart-base-xsum 是基於 facebook/bart-base
在 xsum
數據集上微調的模型,可用於文本摘要任務,在評估集上取得了良好的效果。
🚀 快速開始
此模型是 facebook/bart-base 在 xsum 數據集上的微調版本。它在評估集上取得了以下結果:
- 損失率(Loss):0.8051
- ROUGE-1(R1):0.5643
- ROUGE-2(R2):0.3017
- ROUGE-L(Rl):0.5427
- ROUGE-LSUM(Rlsum):0.5427
模型訓練使用了以下倉庫中的腳本:https://github.com/MorenoLaQuatra/transformers-tasks-templates
📚 詳細文檔
訓練和評估數據
更多信息待補充。
模型描述
更多信息待補充。
預期用途和限制
更多信息待補充。
🔧 技術細節
訓練過程
訓練超參數
訓練期間使用了以下超參數:
- 學習率(learning_rate):5e-05
- 訓練批次大小(train_batch_size):32
- 評估批次大小(eval_batch_size):32
- 隨機種子(seed):42
- 優化器(optimizer):Adam,β1 = 0.9,β2 = 0.999,ε = 1e-08
- 學習率調度器類型(lr_scheduler_type):線性
- 學習率調度器熱身步數(lr_scheduler_warmup_steps):500
- 訓練輪數(num_epochs):10
訓練結果
訓練損失 |
輪數 |
步數 |
驗證損失 |
ROUGE-1 |
ROUGE-2 |
ROUGE-L |
ROUGE-LSUM |
0.8983 |
1.0 |
6377 |
0.8145 |
0.5443 |
0.2724 |
0.5212 |
0.5211 |
0.8211 |
2.0 |
12754 |
0.7940 |
0.5519 |
0.2831 |
0.5295 |
0.5295 |
0.7701 |
3.0 |
19131 |
0.7839 |
0.5569 |
0.2896 |
0.5347 |
0.5348 |
0.7046 |
4.0 |
25508 |
0.7792 |
0.5615 |
0.2956 |
0.5394 |
0.5393 |
0.6837 |
5.0 |
31885 |
0.7806 |
0.5631 |
0.2993 |
0.5416 |
0.5416 |
0.6412 |
6.0 |
38262 |
0.7816 |
0.5643 |
0.301 |
0.5427 |
0.5426 |
0.6113 |
7.0 |
44639 |
0.7881 |
0.5645 |
0.3017 |
0.5428 |
0.5428 |
0.5855 |
8.0 |
51016 |
0.7921 |
0.5651 |
0.303 |
0.5433 |
0.5432 |
0.5636 |
9.0 |
57393 |
0.7972 |
0.5649 |
0.3032 |
0.5433 |
0.5433 |
0.5482 |
10.0 |
63770 |
0.7996 |
0.565 |
0.3036 |
0.5436 |
0.5435 |
框架版本
- Transformers:4.22.1
- Pytorch:1.11.0+cu113
- Datasets:2.0.0
- Tokenizers:0.11.6
📄 許可證
本項目採用 Apache-2.0 許可證。
模型指標詳情
任務類型 |
數據集名稱 |
數據集分割 |
指標類型 |
指標值 |
指標名稱 |
文本摘要 |
xsum |
測試集 |
rouge |
38.6513 |
ROUGE-1 |
文本摘要 |
xsum |
測試集 |
rouge |
17.7585 |
ROUGE-2 |
文本摘要 |
xsum |
測試集 |
rouge |
32.2033 |
ROUGE-L |
文本摘要 |
xsum |
測試集 |
rouge |
32.2064 |
ROUGE-LSUM |
文本摘要 |
xsum |
測試集 |
loss |
1.822434902191162 |
loss |
文本摘要 |
xsum |
測試集 |
gen_len |
19.7028 |
gen_len |
文本摘要 |
xsum |
驗證集 |
rouge |
38.7415 |
ROUGE-1 |
文本摘要 |
xsum |
驗證集 |
rouge |
17.8295 |
ROUGE-2 |
文本摘要 |
xsum |
驗證集 |
rouge |
32.2861 |
ROUGE-L |
文本摘要 |
xsum |
驗證集 |
rouge |
32.2763 |
ROUGE-LSUM |
文本摘要 |
xsum |
驗證集 |
loss |
1.8132821321487427 |
loss |
文本摘要 |
xsum |
驗證集 |
gen_len |
19.7116 |
gen_len |
文本摘要 |
cnn_dailymail |
測試集 |
rouge |
14.9833 |
ROUGE-1 |
文本摘要 |
cnn_dailymail |
測試集 |
rouge |
3.2788 |
ROUGE-2 |
文本摘要 |
cnn_dailymail |
測試集 |
rouge |
11.0507 |
ROUGE-L |
文本摘要 |
cnn_dailymail |
測試集 |
rouge |
13.3138 |
ROUGE-LSUM |
文本摘要 |
cnn_dailymail |
測試集 |
loss |
5.7526116371154785 |
loss |
文本摘要 |
cnn_dailymail |
測試集 |
gen_len |
18.3794 |
gen_len |