L

Lsg Bart Base 16384 Arxiv

ccdvによって開発
BARTアーキテクチャに基づく長シーケンス処理モデルで、科学論文の要約生成タスクに最適化されており、16384の長文入力をサポート
ダウンロード数 29
リリース時間 : 5/9/2022

モデル概要

このモデルは局所的-スパース-グローバルアテンション機構を採用して長シーケンスを処理し、scientific_papers arxivデータセットでファインチューニングされ、科学論文要約生成タスクに適しています

モデル特徴

長シーケンス処理能力
16384の長文入力をサポートし、完全な科学論文の処理に適しています
局所的-スパース-グローバルアテンション機構
革新的なアテンション機構の組み合わせで、長シーケンス処理の計算効率とモデル性能を効果的にバランスさせます
科学論文最適化
arxiv科学論文データセットで特別にファインチューニングされ、学術テキスト要約タスクに最適化されています

モデル能力

長文要約生成
科学論文内容理解
学術テキスト処理

使用事例

学術研究
科学論文自動要約
長編科学論文に対して簡潔で正確な要約を生成
ROUGE-1: 48.74, ROUGE-2: 20.88, ROUGE-L: 28.50
学術文献処理
長文の学術文献内容を処理・分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase