L

Lsg Bart Base 4096 Wcep

Developed by ccdv
基於LSG-BART架構的長文本摘要生成模型,在WCEP-10數據集上微調,支持4096個token的長序列處理
Downloads 27
Release Time : 5/25/2022

Model Overview

該模型採用局部-稀疏-全局注意力機制處理長序列,適用於長文本摘要生成任務。基於BART-base架構改造,支持高效處理長文檔。

Model Features

長序列處理能力
支持4096個token的長文本處理,通過局部-稀疏-全局注意力機制實現高效計算
多種稀疏注意力模式
提供局部、池化、跨步、塊跨步、歸一化和LSH等多種稀疏注意力配置選項
資源效率優化
支持通過調整塊大小和稀疏度來平衡性能和資源消耗

Model Capabilities

長文本摘要生成
多文檔摘要生成
英語文本處理

Use Cases

文本摘要
新聞文章摘要
為長新聞文章生成簡潔摘要
在WCEP-10測試集上ROUGE-1得分達46.02
研究報告濃縮
從長篇研究報告中提取關鍵信息
支持4096 token的長文檔處理能力
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase