pegasus-finetuned-samsum开源文本摘要模型 - 免费部署，专注对话摘要任务

首页

Pegasus Finetuned Samsum

由 avanishd 开发

该模型是基于google/pegasus-cnn_dailymail在samsum数据集上微调的文本摘要模型，专门用于对话摘要任务。

文本生成

Transformers

英语#对话摘要 #高ROUGE分数 #PEGASUS架构

下载量 20

发布时间 : 4/7/2025

模型简介

该模型设计用于抽象对话摘要，能够接收多轮对话并生成简洁的摘要。在SAMsum数据集上表现出色，ROUGE-1得分达到0.4403。

模型特点

对话摘要优化

专门针对对话数据进行微调，能够有效捕捉对话中的关键信息。

高性能ROUGE指标

在SAMsum数据集上ROUGE-1得分达到0.4403，表现优异。

基于PEGASUS架构

采用Google的PEGASUS预训练模型，具有强大的文本理解能力。

模型能力

对话摘要生成

多轮对话理解

抽象式摘要

使用案例

对话分析

客服对话摘要

自动生成客服对话的摘要，帮助快速了解客户问题和解决方案。

能够准确提取对话中的关键问题和解决措施。

会议记录摘要

将多轮会议对话自动生成为简洁的会议纪要。

能够捕捉会议中的主要讨论点和决策。

🚀 飞马微调版Samsum模型

本模型基于Transformer架构，是在Samsum数据集上对google/pegasus-cnn_dailymail进行微调后的版本，可用于抽象对话摘要，能处理多轮对话并生成简洁摘要。

🚀 快速开始

代码示例

from transformers import pipeline

# 加载摘要生成管道
model_name = "avanishd/pegasus-finetuned-samsum/"
summarizer = pipeline("summarization", model=model_name, tokenizer=model_name)

# 示例对话
dialogue = """
John: Hey, are you free tomorrow?
Alice: I think so, why?
John: Want to catch a movie or grab lunch?
Alice: Sure, lunch sounds good. What time?
John: Let's say 1 PM at the new place downtown?
Alice: Works for me!
"""

# 生成摘要
summary = summarizer(dialogue, max_length=60, min_length=15, do_sample=False)[0]['summary_text']

print("Summary:", summary)

✨ 主要特性

该模型在SOTA文本摘要Papers with Code SAMsum排行榜上截至2025年4月8日排名第10。
专为抽象对话摘要设计，能够处理多轮对话并生成简洁摘要。

📦 安装指南

文档未提供具体安装步骤，可参考transformers库的官方安装说明进行安装。

💻 使用示例

基础用法

from transformers import pipeline

# 加载摘要生成管道
model_name = "avanishd/pegasus-finetuned-samsum/"
summarizer = pipeline("summarization", model=model_name, tokenizer=model_name)

# 示例对话
dialogue = """
John: Hey, are you free tomorrow?
Alice: I think so, why?
John: Want to catch a movie or grab lunch?
Alice: Sure, lunch sounds good. What time?
John: Let's say 1 PM at the new place downtown?
Alice: Works for me!
"""

# 生成摘要
summary = summarizer(dialogue, max_length=60, min_length=15, do_sample=False)[0]['summary_text']

print("Summary:", summary)

📚 详细文档

评估集结果

该模型在评估集上取得了以下结果：

损失值: 1.4245
Rouge-1: 0.4403
Rouge-2: 0.2102
Rouge-L: 0.3491
Rouge-Lsum: 0.3493

训练和评估数据

文档未提供详细信息。

训练过程

训练超参数

训练过程中使用了以下超参数：

学习率: 5e-05
训练批次大小: 1
评估批次大小: 1
随机种子: 42
梯度累积步数: 16
总训练批次大小: 16
优化器: 使用OptimizerNames.ADAMW_TORCH，betas=(0.9, 0.999)，epsilon=1e-08，无额外优化器参数
学习率调度器类型: 线性
学习率调度器热身步数: 500
训练轮数: 1
混合精度训练: 原生自动混合精度（Native AMP）