L

Lsg Bart Base 16384 Mediasum

ccdvによって開発
LSG技術に基づくBARTモデルで、長いシーケンスの要約生成タスクに最適化されており、16384の長さの入力シーケンスをサポート
ダウンロード数 22
リリース時間 : 6/23/2022

モデル概要

このモデルは局所-疎-グローバルアテンション機構を採用し、MediaSumデータセットでファインチューニングされており、長文要約生成タスクに適しています

モデル特徴

長シーケンス処理能力
最大16384トークンの入力シーケンスを処理可能で、長文書要約タスクに適しています
混合アテンション機構
局所、疎、グローバルアテンションを組み合わせ、長距離依存関係を効果的に捕捉
効率的なファインチューニング
1エポック以内でファインチューニングを完了し、高性能を維持しながら計算リソースを節約

モデル能力

長文要約生成
テキスト圧縮
キー情報抽出

使用事例

メディアコンテンツ処理
ニュース記事要約
ニュース記事の核心内容を自動生成
Rouge-Lスコア31.81
インタビュー記録要約
長文インタビュー記録からキーポイントを抽出
Rouge-1スコア35.31
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase