L

Lsg Bart Base 4096 Pubmed

由ccdv開發
基於LSG注意力機制的長序列處理模型,專為科學論文摘要生成任務微調
下載量 21
發布時間 : 5/9/2022

模型概述

該模型是BART-base的改進版本,採用局部-稀疏-全局注意力機制處理長序列輸入,在PubMed科學論文數據集上微調,適用於長文本摘要生成任務。

模型特點

長序列處理能力
支持最長4096 tokens的輸入序列,採用局部-稀疏-全局注意力機制高效處理長文本
多種注意力模式
提供局部、池化、跨步、塊跨步、歸一化和LSH等多種稀疏注意力模式選擇
科學論文優化
在PubMed科學論文數據集上專門微調,適合學術文本摘要生成

模型能力

長文本處理
科學論文摘要生成
序列到序列轉換

使用案例

學術研究
科學論文自動摘要
為長篇科研論文生成簡潔準確的摘要
在PubMed測試集上ROUGE-1得分47.37
文獻處理
醫學文獻摘要
處理醫學領域的長篇研究文獻,提取關鍵信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase