L

Long T5 Tglobal Xl 16384 Book Summary

由pszemraj開發
基於BookSum數據集微調的LongT5-XL模型,專為長文本摘要設計,能生成類似SparkNotes的摘要。
下載量 58
發布時間 : 11/27/2022

模型概述

該模型在kmfoda/booksum數據集上微調,擅長處理學術和敘述性文本,能生成高質量的摘要內容。

模型特點

長文本處理能力
支持最長16384個token的輸入文本,適合處理書籍章節等長文檔。
高質量摘要
從人類評估角度看,XL檢查點能生成更好的摘要內容。
多領域適用性
對學術和敘述性文本都有較好的泛化能力。
LLM.int8量化支持
支持8位量化,顯著減少內存使用同時保持摘要質量。

模型能力

長文本摘要
書籍章節總結
學術論文摘要
法律文檔摘要

使用案例

教育
書籍摘要生成
為學生生成類似SparkNotes的書籍章節摘要
生成易於理解的章節概述
研究
學術論文摘要
為研究人員生成長篇論文的簡明摘要
ROUGE-1得分36.2043(multi_news數據集)
法律
法律文檔摘要
總結冗長的法律文件
ROUGE-1得分41.3645(billsum數據集)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase