P

Pegasus Newsroom

由google開發
PEGASUS是基於抽取間隔句子的抽象摘要預訓練模型,由Google Research團隊開發,專注於生成高質量的文本摘要。
下載量 52
發布時間 : 3/2/2022

模型概述

PEGASUS是一種預訓練模型,專門用於抽象摘要生成任務,通過抽取間隔句子進行預訓練,能夠在多個摘要數據集上取得優異表現。

模型特點

混合與隨機訓練
同時在C4和HugeNews數據集上進行訓練,並採用隨機採樣和混合策略,提升模型性能。
動態間隔句子比例
訓練時均勻採樣15%至45%之間的間隔句子比例,增強模型的泛化能力。
重要性句子採樣
在重要性句子採樣時添加20%的均勻噪聲,提高模型的魯棒性。
支持換行符編碼
更新了SentencePiece分詞器以支持編碼換行符,保留段落分割信息。

模型能力

文本摘要生成
多數據集適配
抽象摘要
預訓練模型微調

使用案例

新聞摘要
CNN/DailyMail摘要
生成CNN/DailyMail新聞文章的簡潔摘要。
ROUGE-1/2/L: 44.16/21.56/41.30
XSum摘要
生成極端摘要(單句摘要)任務的高質量結果。
ROUGE-1/2/L: 47.60/24.83/39.64
學術論文摘要
arXiv論文摘要
生成學術論文的簡明摘要。
ROUGE-1/2/L: 44.21/16.95/25.67
PubMed摘要
生成生物醫學文獻的摘要。
ROUGE-1/2/L: 45.97/20.15/28.25
技術文檔摘要
BigPatent摘要
生成專利文檔的摘要。
ROUGE-1/2/L: 52.29/33.08/41.66
WikiHow摘要
生成WikiHow教程文章的摘要。
ROUGE-1/2/L: 46.39/22.12/38.41
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase