D

Distill Pegasus Cnn 16 4

sshleiferによって開発
PEGASUSは、重要な文を抽出して事前学習された抽象的要約生成モデルで、Google Researchチームによって開発されました。
ダウンロード数 286
リリース時間 : 3/2/2022

モデル概要

PEGASUSは、テキスト要約生成に特化した事前学習モデルで、重要な文を抽出して事前学習を行い、さまざまな要約生成タスクに適用できます。

モデル特徴

混合とランダムトレーニング
C4とHugeNewsデータセットで同時にトレーニングを行い、混合比率の重み付けとランダムサンプリング戦略を採用しています。
強化されたトークナイザー
SentencePieceトークナイザーを更新し、改行文字のエンコーディングをサポートし、段落分割情報を保持します。
柔軟な文サンプリング
15%-45%の文間隔比率を均一にサンプリングし、重要性スコアに20%の均一ノイズを追加します。

モデル能力

テキスト要約生成
複数ドキュメント要約
抽象的要約

使用事例

ニュース要約
CNN/DailyMail要約
ニュース記事の簡潔な要約を生成
ROUGE-1/2/L: 44.16/21.56/41.30
XSum要約
極端な要約(1文の要約)を生成
ROUGE-1/2/L: 47.60/24.83/39.64
学術文献要約
arXiv論文要約
学術論文の要約を生成
ROUGE-1/2/L: 44.21/16.95/25.67
PubMed要約
医学文献の要約を生成
ROUGE-1/2/L: 45.97/20.15/28.25
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase