L

Lsg Bart Base 4096 Mediasum

ccdvによって開発
LSG技術に基づくBART-baseモデルで、長文要約タスク向けにMediaSumデータセットでファインチューニングされ、4096長のシーケンス処理をサポート
ダウンロード数 44
リリース時間 : 5/29/2022

モデル概要

このモデルは局所-疎密-グローバルアテンション機構を用いて長いシーケンスを処理し、長文要約生成タスクに適しています。BART-baseアーキテクチャを基に改造され、MediaSum対話要約データセットでファインチューニングされました。

モデル特徴

長シーケンス処理能力
最大4096トークンのシーケンス入力をサポートし、局所-疎密-グローバルアテンション機構で長文を効率的に処理
マルチモード疎密アテンション
局所/プーリング/ストライド/ブロックストライド/正規化/LSHなど多様な疎密アテンションモードを提供
リソース効率最適化
ブロックサイズ(32-256)を調整して性能とリソース消費のバランスを取り、異なるハードウェア条件に適応

モデル能力

長文要約生成
対話内容要約
多輪対話理解

使用事例

メディアコンテンツ処理
インタビュー要約生成
長編メディアインタビュー内容を簡潔な要約に圧縮
MediaSumテストセットでR1=35.16/R2=18.13/RL=31.54を達成
会議記録処理
会議議事録自動生成
長時間の会議音声転記テキストからキーポイントを抽出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase