bart-base-xsum開源摘要生成模型 - 免費部署精準提煉簡潔摘要

首頁

Bart Base Xsum

由morenolq開發

基於facebook/bart-base在xsum數據集上微調的摘要生成模型，擅長生成簡潔準確的摘要。

文本生成

Transformers

開源協議:Apache-2.0 #新聞摘要生成 #高ROUGE分數 #BART微調

下載量 15

發布時間 : 9/18/2022

模型概述

該模型是基於BART架構的預訓練模型，專門針對摘要生成任務進行了微調，特別適用於生成新聞文章的簡短摘要。

模型特點

高效摘要生成

在XSUM數據集上表現出色，能夠生成簡潔準確的新聞摘要。

多數據集適應

不僅在XSUM數據集上表現良好，也能適應CNN/DailyMail等不同風格的摘要生成任務。

穩定訓練過程

經過10輪訓練，驗證指標穩定提升，顯示出良好的訓練收斂性。

模型能力

文本摘要生成

新聞內容提煉

長文本壓縮

使用案例

新聞媒體

新聞摘要生成

自動為長篇新聞文章生成簡潔摘要

在XSUM測試集上ROUGE-1得分38.6513

內容分析

文檔內容提煉

從長文檔中提取關鍵信息

在CNN/DailyMail測試集上ROUGE-1得分14.9833

🚀 bart-base-xsum

bart-base-xsum 是基於 facebook/bart-base 在 xsum 數據集上微調的模型，可用於文本摘要任務，在評估集上取得了良好的效果。

🚀 快速開始

此模型是 facebook/bart-base 在 xsum 數據集上的微調版本。它在評估集上取得了以下結果：

損失率（Loss）：0.8051
ROUGE-1（R1）：0.5643
ROUGE-2（R2）：0.3017
ROUGE-L（Rl）：0.5427
ROUGE-LSUM（Rlsum）：0.5427

模型訓練使用了以下倉庫中的腳本：https://github.com/MorenoLaQuatra/transformers-tasks-templates

📚 詳細文檔

訓練和評估數據

更多信息待補充。

模型描述

更多信息待補充。

預期用途和限制

更多信息待補充。

🔧 技術細節

訓練過程

訓練超參數

訓練期間使用了以下超參數：

學習率（learning_rate）：5e-05
訓練批次大小（train_batch_size）：32
評估批次大小（eval_batch_size）：32
隨機種子（seed）：42
優化器（optimizer）：Adam，β1 = 0.9，β2 = 0.999，ε = 1e-08
學習率調度器類型（lr_scheduler_type）：線性
學習率調度器熱身步數（lr_scheduler_warmup_steps）：500
訓練輪數（num_epochs）：10

訓練結果

訓練損失	輪數	步數	驗證損失	ROUGE-1	ROUGE-2	ROUGE-L	ROUGE-LSUM
0.8983	1.0	6377	0.8145	0.5443	0.2724	0.5212	0.5211
0.8211	2.0	12754	0.7940	0.5519	0.2831	0.5295	0.5295
0.7701	3.0	19131	0.7839	0.5569	0.2896	0.5347	0.5348
0.7046	4.0	25508	0.7792	0.5615	0.2956	0.5394	0.5393
0.6837	5.0	31885	0.7806	0.5631	0.2993	0.5416	0.5416
0.6412	6.0	38262	0.7816	0.5643	0.301	0.5427	0.5426
0.6113	7.0	44639	0.7881	0.5645	0.3017	0.5428	0.5428
0.5855	8.0	51016	0.7921	0.5651	0.303	0.5433	0.5432
0.5636	9.0	57393	0.7972	0.5649	0.3032	0.5433	0.5433
0.5482	10.0	63770	0.7996	0.565	0.3036	0.5436	0.5435

框架版本

Transformers：4.22.1
Pytorch：1.11.0+cu113
Datasets：2.0.0
Tokenizers：0.11.6

📄 許可證

本項目採用 Apache-2.0 許可證。

模型指標詳情

任務類型	數據集名稱	數據集分割	指標類型	指標值	指標名稱
文本摘要	xsum	測試集	rouge	38.6513	ROUGE-1
文本摘要	xsum	測試集	rouge	17.7585	ROUGE-2
文本摘要	xsum	測試集	rouge	32.2033	ROUGE-L
文本摘要	xsum	測試集	rouge	32.2064	ROUGE-LSUM
文本摘要	xsum	測試集	loss	1.822434902191162	loss
文本摘要	xsum	測試集	gen_len	19.7028	gen_len
文本摘要	xsum	驗證集	rouge	38.7415	ROUGE-1
文本摘要	xsum	驗證集	rouge	17.8295	ROUGE-2
文本摘要	xsum	驗證集	rouge	32.2861	ROUGE-L
文本摘要	xsum	驗證集	rouge	32.2763	ROUGE-LSUM
文本摘要	xsum	驗證集	loss	1.8132821321487427	loss
文本摘要	xsum	驗證集	gen_len	19.7116	gen_len
文本摘要	cnn_dailymail	測試集	rouge	14.9833	ROUGE-1
文本摘要	cnn_dailymail	測試集	rouge	3.2788	ROUGE-2
文本摘要	cnn_dailymail	測試集	rouge	11.0507	ROUGE-L
文本摘要	cnn_dailymail	測試集	rouge	13.3138	ROUGE-LSUM
文本摘要	cnn_dailymail	測試集	loss	5.7526116371154785	loss
文本摘要	cnn_dailymail	測試集	gen_len	18.3794	gen_len