L

Lsg Bart Large 4096

由ccdv開發
LSG模型是基於BART-large改進的長序列處理模型,採用局部+稀疏+全局注意力機制,高效處理長文本任務
下載量 15
發布時間 : 3/2/2022

模型概述

該模型針對編碼器-解碼器任務優化,能高效處理長序列輸入,相比傳統長序列模型具有更快速度和更高效率

模型特點

高效長序列處理
採用局部+稀疏+全局注意力機制(LSG),顯著提升長文本處理效率
自適應序列長度
支持自動填充序列長度至分塊大小的整數倍,確保處理穩定性
多模式稀疏選擇
提供6種稀疏選擇模式(如BOS池化、LSH聚類等),適應不同任務需求
兼容原始架構
保持與BART-large相同的參數規模和層數,共享相同分詞器

模型能力

長文本摘要生成
序列到序列轉換
高效處理4096長度輸入
文本分類

使用案例

文本摘要
長文檔自動摘要
對科研論文、長篇文章等超長文本生成精準摘要
相比傳統模型處理速度提升顯著
文本處理
長文本分類
對超長文檔進行分類任務
保持高準確率的同時降低內存消耗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase