B

Bigbird Pegasus Large Arxiv

googleによって開発
BigBirdは疎な注意力に基づくTransformerモデルで、より長いシーケンスを処理でき、長文書要約などのタスクに適しています。
ダウンロード数 8,528
リリース時間 : 3/2/2022

モデル概要

BigBirdPegasusは疎な注意力に基づくTransformerモデルで、従来のTransformerの能力を拡張し、長いシーケンスのタスク、例えば科学論文の要約生成などに特に適しています。

モデル特徴

疎な注意力機構
ブロック疎な注意力機構を採用し、長さ4096のシーケンスを効率的に処理でき、計算コストは従来の注意力機構より低いです。
長いシーケンスの処理能力
特に超長いシーケンスのタスク、例えば長文書の要約や長いコンテキストの質問応答に適しています。
多タスク適応性
様々な要約生成タスク、科学論文やニュースの要約を含め、良好な性能を発揮します。

モデル能力

科学論文の要約生成
長文書の要約生成
長いコンテキストの質問応答

使用事例

学術研究
科学論文の要約生成
科学論文に対して簡潔で正確な要約を生成します。
arxivデータセットでROUGE - 1スコアが43.4702です。
ニュースメディア
ニュースの要約生成
ニュース記事に対して要約を生成します。
cnn_dailymailデータセットでROUGE - 1スコアが9.0885です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase