L

Lsg Bart Base 4096 Pubmed

ccdvによって開発
LSGアテンションメカニズムに基づく長シーケンス処理モデル、科学論文要約生成タスク用にファインチューニング
ダウンロード数 21
リリース時間 : 5/9/2022

モデル概要

このモデルはBART-baseの改良版で、局所的-疎-グローバルアテンションメカニズムを使用して長いシーケンス入力を処理し、PubMed科学論文データセットでファインチューニングされており、長文要約生成タスクに適しています。

モデル特徴

長シーケンス処理能力
最大4096トークンの入力シーケンスをサポートし、局所的-疎-グローバルアテンションメカニズムで長文を効率的に処理
複数のアテンションモード
局所的、プーリング、ストライド、ブロックストライド、正規化、LSHなど、さまざまな疎アテーションモードを提供
科学論文最適化
PubMed科学論文データセットで特別にファインチューニングされており、学術テキスト要約生成に適しています

モデル能力

長文処理
科学論文要約生成
シーケンス間変換

使用事例

学術研究
科学論文自動要約
長編研究論文に対して簡潔で正確な要約を生成
PubMedテストセットでROUGE-1スコア47.37
文献処理
医学文献要約
医学分野の長編研究文献を処理し、キー情報を抽出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase