L

Lsg Bart Base 4096 Wcep

由ccdv開發
基於LSG-BART架構的長文本摘要生成模型,在WCEP-10數據集上微調,支持4096個token的長序列處理
下載量 27
發布時間 : 5/25/2022

模型概述

該模型採用局部-稀疏-全局注意力機制處理長序列,適用於長文本摘要生成任務。基於BART-base架構改造,支持高效處理長文檔。

模型特點

長序列處理能力
支持4096個token的長文本處理,通過局部-稀疏-全局注意力機制實現高效計算
多種稀疏注意力模式
提供局部、池化、跨步、塊跨步、歸一化和LSH等多種稀疏注意力配置選項
資源效率優化
支持通過調整塊大小和稀疏度來平衡性能和資源消耗

模型能力

長文本摘要生成
多文檔摘要生成
英語文本處理

使用案例

文本摘要
新聞文章摘要
為長新聞文章生成簡潔摘要
在WCEP-10測試集上ROUGE-1得分達46.02
研究報告濃縮
從長篇研究報告中提取關鍵信息
支持4096 token的長文檔處理能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase