L

Lsg Bart Base 16384 Mediasum

Developed by ccdv
基於LSG技術的BART模型,專為處理長序列摘要生成任務優化,支持16384長度的輸入序列
Downloads 22
Release Time : 6/23/2022

Model Overview

該模型採用局部-稀疏-全局注意力機制,在MediaSum數據集上微調,適用於長文本摘要生成任務

Model Features

長序列處理能力
支持處理長達16384個token的輸入序列,適合長文檔摘要任務
混合注意力機制
結合局部、稀疏和全局注意力,有效捕捉長距離依賴關係
高效微調
在1個epoch內完成微調,保持高性能的同時節省計算資源

Model Capabilities

長文本摘要生成
文本壓縮
關鍵信息提取

Use Cases

媒體內容處理
新聞文章摘要
自動生成新聞文章的核心內容摘要
Rouge-L得分31.81
訪談記錄總結
從長篇訪談記錄中提取關鍵對話要點
Rouge-1得分35.31
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase