B

Bigbird Pegasus Large Bigpatent

由google開發
BigBird是一種基於稀疏注意力的Transformer模型,能夠處理長達4096的序列,適用於長文檔摘要等任務。
下載量 945
發布時間 : 3/2/2022

模型概述

BigBird採用塊稀疏注意力機制替代常規注意力,能以較低計算成本處理長序列,在長文檔摘要等任務中表現優異。

模型特點

塊稀疏注意力機制
使用塊稀疏注意力替代常規注意力,顯著降低長序列處理的計算成本。
長序列處理能力
能夠高效處理長達4096的序列,適合長文檔任務。
靈活配置
支持調整塊大小和隨機塊數量,平衡性能與計算資源。

模型能力

長文本摘要生成
長上下文理解

使用案例

文檔處理
專利文檔摘要
為長專利文檔生成簡潔摘要
在big_patent數據集上微調後獲得
長文檔問答
基於長文檔內容回答問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase