P

Pegasus Arxiv

由google開發
PEGASUS是基於間隙句子提取的預訓練抽象摘要模型,通過混合與隨機化策略優化摘要生成效果
下載量 333
發布時間 : 3/2/2022

模型概述

一種基於Transformer的預訓練模型,專門用於文本摘要任務,通過間隙句子預測目標進行預訓練

模型特點

混合與隨機化訓練
同時基於C4和HugeNews數據集訓練,採用隨機採樣間隔句子比例和重要性分數噪聲擾動
動態間隔句子採樣
訓練時動態採樣15%-45%的間隔句子比例,增強模型泛化能力
改進分詞器
升級SentencePiece分詞器支持換行符編碼,保留段落結構信息
長時訓練
訓練步數擴展至150萬步,確保模型充分收斂

模型能力

文本摘要生成
多領域摘要適應
抽象式摘要

使用案例

新聞摘要
CNN/DailyMail新聞摘要
為新聞文章生成簡潔摘要
ROUGE-1/2/L: 44.16/21.56/41.30
學術論文摘要
arXiv論文摘要
生成學術論文的技術摘要
ROUGE-1/2/L: 44.21/16.95/25.67
法律文檔處理
法案摘要
為法律法案生成執行摘要
ROUGE-1/2/L: 59.67/41.58/47.59
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase