L

Lsg Bart Base 16384 Mediasum

由ccdv開發
基於LSG技術的BART模型,專為處理長序列摘要生成任務優化,支持16384長度的輸入序列
下載量 22
發布時間 : 6/23/2022

模型概述

該模型採用局部-稀疏-全局注意力機制,在MediaSum數據集上微調,適用於長文本摘要生成任務

模型特點

長序列處理能力
支持處理長達16384個token的輸入序列,適合長文檔摘要任務
混合注意力機制
結合局部、稀疏和全局注意力,有效捕捉長距離依賴關係
高效微調
在1個epoch內完成微調,保持高性能的同時節省計算資源

模型能力

長文本摘要生成
文本壓縮
關鍵信息提取

使用案例

媒體內容處理
新聞文章摘要
自動生成新聞文章的核心內容摘要
Rouge-L得分31.81
訪談記錄總結
從長篇訪談記錄中提取關鍵對話要點
Rouge-1得分35.31
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase