L

Lsg Bart Base 4096 Multinews

由ccdv開發
基於LSG技術的BART-base模型,專為長文本摘要任務設計,支持4096長度的輸入序列
下載量 26
發布時間 : 5/25/2022

模型概述

該模型採用局部-稀疏-全局注意力機制處理長序列,在multi_news數據集上微調,適用於多文檔摘要生成任務

模型特點

長序列處理能力
支持最長4096 tokens的輸入序列,採用局部-稀疏-全局注意力機制高效處理長文本
多文檔摘要優化
在multi_news數據集上微調,專門針對多文檔摘要場景優化
靈活注意力配置
支持多種稀疏注意力模式(池化/跨步/塊跨步/歸一化/LSH),可根據需求平衡性能與資源消耗

模型能力

長文本摘要生成
多文檔信息整合
英文文本處理

使用案例

新聞摘要
多源新聞摘要
從多個相關新聞文章中生成統一摘要
在multi_news測試集上達到R1 47.10/R2 18.94/RL 25.22
文檔整理
長文檔摘要
對技術文檔、研究報告等長文本生成精簡摘要
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase