L

Lsg Bart Large 4096

ccdvによって開発
LSGモデルはBART-largeを改良した長シーケンス処理モデルで、局所的+疎+グローバルアテンション機構を採用し、長文タスクを効率的に処理
ダウンロード数 15
リリース時間 : 3/2/2022

モデル概要

このモデルはエンコーダ-デコーダタスク向けに最適化されており、長いシーケンス入力を効率的に処理でき、従来の長シーケンスモデルに比べてより高速で効率的

モデル特徴

効率的な長シーケンス処理
局所的+疎+グローバルアテンション機構(LSG)を採用し、長文処理効率を大幅に向上
適応的シーケンス長
シーケンス長を自動的にチャンクサイズの整数倍にパディングし、処理安定性を確保
マルチモード疎選択
6種類の疎選択モード(BOSプーリング、LSHクラスタリングなど)を提供し、様々なタスクニーズに対応
オリジナルアーキテクチャ互換
BART-largeと同じパラメータ規模と層数を維持し、同じトークナイザーを共有

モデル能力

長文要約生成
シーケンス間変換
4096長入力の効率的処理
テキスト分類

使用事例

テキスト要約
長文書類自動要約
研究論文、長文記事などの超長文テキストに対して正確な要約を生成
従来モデルに比べて処理速度が大幅に向上
テキスト処理
長文分類
超長文書に対して分類タスクを実行
高い精度を維持しながらメモリ消費を低減
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase