B

Bigbird Pegasus Large Arxiv

由google開發
BigBird是一種基於稀疏注意力的Transformer模型,能夠處理更長的序列,適用於長文檔摘要等任務。
下載量 8,528
發布時間 : 3/2/2022

模型概述

BigBirdPegasus是基於稀疏注意力的Transformer模型,擴展了傳統Transformer的能力,特別適合處理長序列任務,如科學論文摘要生成。

模型特點

稀疏注意力機制
採用塊稀疏注意力機制,能夠高效處理長達4096的序列,計算成本低於傳統注意力機制。
長序列處理能力
特別適合處理超長序列任務,如長文檔摘要和長上下文問答。
多任務適應
在多種摘要生成任務上表現良好,包括科學論文和新聞摘要。

模型能力

科學論文摘要生成
長文檔摘要生成
長上下文問答

使用案例

學術研究
科學論文摘要生成
為科學論文生成簡潔準確的摘要。
在arxiv數據集上ROUGE-1得分43.4702。
新聞媒體
新聞摘要生成
為新聞文章生成摘要。
在cnn_dailymail數據集上ROUGE-1得分9.0885。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase