L

Lsg Bart Base 4096 Multinews

ccdvによって開発
LSG技術に基づくBART-baseモデルで、長文要約タスク向けに設計されており、4096長の入力シーケンスをサポート
ダウンロード数 26
リリース時間 : 5/25/2022

モデル概要

このモデルは局所-疎密-グローバルアテンション機構を採用して長いシーケンスを処理し、multi_newsデータセットでファインチューニングされており、マルチドキュメント要約生成タスクに適しています

モデル特徴

長シーケンス処理能力
最大4096トークンの入力シーケンスをサポートし、局所-疎密-グローバルアテンション機構で長文を効率的に処理
マルチドキュメント要約最適化
multi_newsデータセットでファインチューニングされており、マルチドキュメント要約シナリオに特化して最適化されています
柔軟なアテンション設定
複数の疎密アテンションモード(プーリング/ストライド/ブロックストライド/正規化/LSH)をサポートし、ニーズに応じてパフォーマンスとリソース消費のバランスを調整可能

モデル能力

長文要約生成
マルチドキュメント情報統合
英語テキスト処理

使用事例

ニュース要約
マルチソースニュース要約
複数の関連ニュース記事から統一された要約を生成
multi_newsテストセットでR1 47.10/R2 18.94/RL 25.22を達成
ドキュメント整理
長文書要約
技術文書、研究レポートなどの長文に対して簡潔な要約を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase