bart-base-xsum开源摘要生成模型 - 免费部署精准提炼简洁摘要

首页

Bart Base Xsum

由 morenolq 开发

基于facebook/bart-base在xsum数据集上微调的摘要生成模型，擅长生成简洁准确的摘要。

文本生成

Transformers

开源协议:Apache-2.0 #新闻摘要生成 #高ROUGE分数 #BART微调

下载量 15

发布时间 : 9/18/2022

模型简介

该模型是基于BART架构的预训练模型，专门针对摘要生成任务进行了微调，特别适用于生成新闻文章的简短摘要。

模型特点

高效摘要生成

在XSUM数据集上表现出色，能够生成简洁准确的新闻摘要。

多数据集适应

不仅在XSUM数据集上表现良好，也能适应CNN/DailyMail等不同风格的摘要生成任务。

稳定训练过程

经过10轮训练，验证指标稳定提升，显示出良好的训练收敛性。

模型能力

文本摘要生成

新闻内容提炼

长文本压缩

使用案例

新闻媒体

新闻摘要生成

自动为长篇新闻文章生成简洁摘要

在XSUM测试集上ROUGE-1得分38.6513

内容分析

文档内容提炼

从长文档中提取关键信息

在CNN/DailyMail测试集上ROUGE-1得分14.9833

🚀 bart-base-xsum

bart-base-xsum 是基于 facebook/bart-base 在 xsum 数据集上微调的模型，可用于文本摘要任务，在评估集上取得了良好的效果。

🚀 快速开始

此模型是 facebook/bart-base 在 xsum 数据集上的微调版本。它在评估集上取得了以下结果：

损失率（Loss）：0.8051
ROUGE-1（R1）：0.5643
ROUGE-2（R2）：0.3017
ROUGE-L（Rl）：0.5427
ROUGE-LSUM（Rlsum）：0.5427

模型训练使用了以下仓库中的脚本：https://github.com/MorenoLaQuatra/transformers-tasks-templates

📚 详细文档

训练和评估数据

更多信息待补充。

模型描述

更多信息待补充。

预期用途和限制

更多信息待补充。

🔧 技术细节

训练过程

训练超参数

训练期间使用了以下超参数：

学习率（learning_rate）：5e-05
训练批次大小（train_batch_size）：32
评估批次大小（eval_batch_size）：32
随机种子（seed）：42
优化器（optimizer）：Adam，β1 = 0.9，β2 = 0.999，ε = 1e-08
学习率调度器类型（lr_scheduler_type）：线性
学习率调度器热身步数（lr_scheduler_warmup_steps）：500
训练轮数（num_epochs）：10

训练结果

训练损失	轮数	步数	验证损失	ROUGE-1	ROUGE-2	ROUGE-L	ROUGE-LSUM
0.8983	1.0	6377	0.8145	0.5443	0.2724	0.5212	0.5211
0.8211	2.0	12754	0.7940	0.5519	0.2831	0.5295	0.5295
0.7701	3.0	19131	0.7839	0.5569	0.2896	0.5347	0.5348
0.7046	4.0	25508	0.7792	0.5615	0.2956	0.5394	0.5393
0.6837	5.0	31885	0.7806	0.5631	0.2993	0.5416	0.5416
0.6412	6.0	38262	0.7816	0.5643	0.301	0.5427	0.5426
0.6113	7.0	44639	0.7881	0.5645	0.3017	0.5428	0.5428
0.5855	8.0	51016	0.7921	0.5651	0.303	0.5433	0.5432
0.5636	9.0	57393	0.7972	0.5649	0.3032	0.5433	0.5433
0.5482	10.0	63770	0.7996	0.565	0.3036	0.5436	0.5435

框架版本

Transformers：4.22.1
Pytorch：1.11.0+cu113
Datasets：2.0.0
Tokenizers：0.11.6

📄 许可证

本项目采用 Apache-2.0 许可证。

模型指标详情

任务类型	数据集名称	数据集分割	指标类型	指标值	指标名称
文本摘要	xsum	测试集	rouge	38.6513	ROUGE-1
文本摘要	xsum	测试集	rouge	17.7585	ROUGE-2
文本摘要	xsum	测试集	rouge	32.2033	ROUGE-L
文本摘要	xsum	测试集	rouge	32.2064	ROUGE-LSUM
文本摘要	xsum	测试集	loss	1.822434902191162	loss
文本摘要	xsum	测试集	gen_len	19.7028	gen_len
文本摘要	xsum	验证集	rouge	38.7415	ROUGE-1
文本摘要	xsum	验证集	rouge	17.8295	ROUGE-2
文本摘要	xsum	验证集	rouge	32.2861	ROUGE-L
文本摘要	xsum	验证集	rouge	32.2763	ROUGE-LSUM
文本摘要	xsum	验证集	loss	1.8132821321487427	loss
文本摘要	xsum	验证集	gen_len	19.7116	gen_len
文本摘要	cnn_dailymail	测试集	rouge	14.9833	ROUGE-1
文本摘要	cnn_dailymail	测试集	rouge	3.2788	ROUGE-2
文本摘要	cnn_dailymail	测试集	rouge	11.0507	ROUGE-L
文本摘要	cnn_dailymail	测试集	rouge	13.3138	ROUGE-LSUM
文本摘要	cnn_dailymail	测试集	loss	5.7526116371154785	loss
文本摘要	cnn_dailymail	测试集	gen_len	18.3794	gen_len