B

Bigbird Roberta Large

由google開發
BigBird是一種基於稀疏注意力的Transformer模型,能夠處理長達4096的序列,適用於長文檔任務。
下載量 1,152
發布時間 : 3/2/2022

模型概述

BigBird通過塊稀疏注意力機制擴展了傳統Transformer模型的處理能力,顯著降低了長序列處理的計算成本,適用於長文檔摘要、長上下文問答等任務。

模型特點

稀疏注意力機制
使用塊稀疏注意力而非普通注意力,顯著降低長序列處理的計算成本。
長序列處理
能夠處理長達4096的序列,適用於長文檔任務。
靈活配置
支持調整注意力類型(塊稀疏或全注意力)、塊大小和隨機塊數量。

模型能力

長文檔摘要
長上下文問答
掩碼語言建模

使用案例

自然語言處理
長文檔摘要
處理超長文檔並生成摘要。
在長文檔摘要任務中達到最先進水平。
長上下文問答
回答需要長上下文理解的問題。
在長上下文問答任務中表現優異。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase