L

Lsg Bart Base 4096 Mediasum

由ccdv開發
基於LSG技術的BART-base模型,針對長文本摘要任務在MediaSum數據集上微調,支持4096長度的序列處理
下載量 44
發布時間 : 5/29/2022

模型概述

該模型採用局部-稀疏-全局注意力機制處理長序列,適用於長文本摘要生成任務。基於BART-base架構改造,在MediaSum對話摘要數據集上微調。

模型特點

長序列處理能力
支持最長4096 token的序列輸入,通過局部-稀疏-全局注意力機制高效處理長文本
多模式稀疏注意力
提供局部/池化/跨步/塊跨步/歸一化/LSH等多種稀疏注意力模式選擇
資源效率優化
支持調整塊大小(32-256)平衡性能與資源消耗,適應不同硬件條件

模型能力

長文本摘要生成
對話內容摘要
多輪對話理解

使用案例

媒體內容處理
訪談摘要生成
將長篇媒體訪談內容壓縮為簡潔摘要
在MediaSum測試集上達到R1=35.16/R2=18.13/RL=31.54
會議記錄處理
會議紀要自動生成
從長時間會議錄音轉寫文本中提取關鍵要點
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase