pegasus-finetuned-samsum開源文本摘要模型 - 免費部署，專注對話摘要任務

首頁

Pegasus Finetuned Samsum

由avanishd開發

該模型是基於google/pegasus-cnn_dailymail在samsum數據集上微調的文本摘要模型，專門用於對話摘要任務。

文本生成

Transformers

英語#對話摘要 #高ROUGE分數 #PEGASUS架構

下載量 20

發布時間 : 4/7/2025

模型概述

該模型設計用於抽象對話摘要，能夠接收多輪對話並生成簡潔的摘要。在SAMsum數據集上表現出色，ROUGE-1得分達到0.4403。

模型特點

對話摘要優化

專門針對對話數據進行微調，能夠有效捕捉對話中的關鍵信息。

高性能ROUGE指標

在SAMsum數據集上ROUGE-1得分達到0.4403，表現優異。

基於PEGASUS架構

採用Google的PEGASUS預訓練模型，具有強大的文本理解能力。

模型能力

對話摘要生成

多輪對話理解

抽象式摘要

使用案例

對話分析

客服對話摘要

自動生成客服對話的摘要，幫助快速瞭解客戶問題和解決方案。

能夠準確提取對話中的關鍵問題和解決措施。

會議記錄摘要

將多輪會議對話自動生成為簡潔的會議紀要。

能夠捕捉會議中的主要討論點和決策。

🚀 飛馬微調版Samsum模型

本模型基於Transformer架構，是在Samsum數據集上對google/pegasus-cnn_dailymail進行微調後的版本，可用於抽象對話摘要，能處理多輪對話並生成簡潔摘要。

🚀 快速開始

代碼示例

from transformers import pipeline

# 加載摘要生成管道
model_name = "avanishd/pegasus-finetuned-samsum/"
summarizer = pipeline("summarization", model=model_name, tokenizer=model_name)

# 示例對話
dialogue = """
John: Hey, are you free tomorrow?
Alice: I think so, why?
John: Want to catch a movie or grab lunch?
Alice: Sure, lunch sounds good. What time?
John: Let's say 1 PM at the new place downtown?
Alice: Works for me!
"""

# 生成摘要
summary = summarizer(dialogue, max_length=60, min_length=15, do_sample=False)[0]['summary_text']

print("Summary:", summary)

✨ 主要特性

該模型在SOTA文本摘要Papers with Code SAMsum排行榜上截至2025年4月8日排名第10。
專為抽象對話摘要設計，能夠處理多輪對話並生成簡潔摘要。

📦 安裝指南

文檔未提供具體安裝步驟，可參考transformers庫的官方安裝說明進行安裝。

💻 使用示例

基礎用法

from transformers import pipeline

# 加載摘要生成管道
model_name = "avanishd/pegasus-finetuned-samsum/"
summarizer = pipeline("summarization", model=model_name, tokenizer=model_name)

# 示例對話
dialogue = """
John: Hey, are you free tomorrow?
Alice: I think so, why?
John: Want to catch a movie or grab lunch?
Alice: Sure, lunch sounds good. What time?
John: Let's say 1 PM at the new place downtown?
Alice: Works for me!
"""

# 生成摘要
summary = summarizer(dialogue, max_length=60, min_length=15, do_sample=False)[0]['summary_text']

print("Summary:", summary)

📚 詳細文檔

評估集結果

該模型在評估集上取得了以下結果：

損失值: 1.4245
Rouge-1: 0.4403
Rouge-2: 0.2102
Rouge-L: 0.3491
Rouge-Lsum: 0.3493

訓練和評估數據

文檔未提供詳細信息。

訓練過程

訓練超參數

訓練過程中使用了以下超參數：

學習率: 5e-05
訓練批次大小: 1
評估批次大小: 1
隨機種子: 42
梯度累積步數: 16
總訓練批次大小: 16
優化器: 使用OptimizerNames.ADAMW_TORCH，betas=(0.9, 0.999)，epsilon=1e-08，無額外優化器參數
學習率調度器類型: 線性
學習率調度器熱身步數: 500
訓練輪數: 1
混合精度訓練: 原生自動混合精度（Native AMP）