fulltrain-xsum-bart开源模型 - 免费部署，精准生成英文抽象摘要

首页

Fulltrain Xsum Bart

由 bhargavis 开发

基于XSum数据集微调的BART-large模型，用于生成英文抽象摘要

文本生成

Transformers

英语开源协议:MIT #极限摘要生成 #BBC新闻适配 #单句摘要优化

下载量 108

发布时间 : 2/5/2025

模型简介

该模型针对BBC文章的极限摘要任务进行优化，能够将长文档压缩为简洁的单句摘要

模型特点

极限摘要生成

专为生成极简单句摘要而优化，适合需要高度凝练的摘要场景

BBC内容适配

基于BBC新闻文章训练，对类似风格的文本有最佳表现

高效训练配置

采用FP16加速和优化训练策略，在2块T4 GPU上仅需9小时完成训练

模型能力

文本摘要生成

英文内容处理

长文本压缩

使用案例

新闻摘要

新闻快报生成

将长篇新闻报道压缩为单句要点

生成符合人类写作习惯的简洁摘要

内容分析

文档核心提取

从长文档中提取核心陈述

ROUGE-1得分达0.401

🚀 全量训练XSum数据集的BART摘要模型

本模型基于BART架构，在XSum数据集上进行微调，用于抽象式文本摘要任务。它能接收长文档输入并生成简洁的摘要，为信息提取提供高效解决方案。

✨ 主要特性

架构：采用BART（双向和自回归变换器）架构。
任务：专注于抽象式文本摘要。
数据集：基于XSum（极端摘要）数据集进行训练。
训练硬件：使用2块NVIDIA T4 GPU（借助Kaggle平台）。
训练时间：约9小时。

📦 安装指南

文档未提及具体安装步骤，可参考Hugging Face的transformers库安装方法。

💻 使用示例

基础用法

from transformers import pipeline

# 加载微调后的模型
summarizer = pipeline("summarization", model="bhargavis/fulltrain-xsum-bart")

# 提供输入文本
input_text = """
Authorities have issued a warning after multiple sightings of a large brown bear in the woods. The bear is known to become aggressive if disturbed, and residents are urged to exercise caution. Last week, a group of hikers reported a close encounter with the animal. While no injuries were sustained, the bear displayed defensive behavior when approached. Wildlife officials advise keeping a safe distance and avoiding the area if possible. Those encountering the bear should remain calm, back away slowly, and refrain from making sudden movements. Officials continue to monitor the situation.
"""

# 生成摘要
summary = summarizer(input_text, max_length=64, min_length=30, do_sample=False)
print(summary[0]["summary_text"])

📚 详细文档

数据集详情

数据集类型	样本数量
训练集	204,045个样本
验证集	11,332个样本
测试集	11,334个样本

XSum数据集包含BBC文章及其对应的单句摘要。模型经过训练，旨在生成简洁且能抓住输入文档核心内容的摘要。

训练详情

训练参数	值
训练轮数	1
批次大小	8（每个设备）
学习率	5e - 5
权重衰减	0.01
热身步数	500
FP16训练	启用
评估策略	每轮评估
最佳模型选择	基于验证损失（eval_loss）

评估指标

模型使用以下指标进行评估：

指标	得分
训练损失	0.3771
验证损失	0.350379
Rouge - 1	0.401344019
Rouge - 2	0.188076798
Rouge - L	0.33460693

这些指标使用rouge_scorer库计算ROUGE分数。

训练参数

模型使用以下Hugging Face Seq2SeqTrainingArguments进行训练：

参数	值
保存策略	每轮保存
日志记录步数	1000
数据加载器工作进程数	4
预测时生成	启用
训练结束时加载最佳模型	启用
最佳模型评估指标	验证损失（eval_loss）
分数越高越好	否（验证损失越低越好）
报告工具	Weights & Biases (WandB)