L

Long T5 Tglobal Xl 16384 Book Summary

Developed by pszemraj
基于BookSum数据集微调的LongT5-XL模型,专为长文本摘要设计,能生成类似SparkNotes的摘要。
Downloads 58
Release Time : 11/27/2022

Model Overview

该模型在kmfoda/booksum数据集上微调,擅长处理学术和叙述性文本,能生成高质量的摘要内容。

Model Features

长文本处理能力
支持最长16384个token的输入文本,适合处理书籍章节等长文档。
高质量摘要
从人类评估角度看,XL检查点能生成更好的摘要内容。
多领域适用性
对学术和叙述性文本都有较好的泛化能力。
LLM.int8量化支持
支持8位量化,显著减少内存使用同时保持摘要质量。

Model Capabilities

长文本摘要
书籍章节总结
学术论文摘要
法律文档摘要

Use Cases

教育
书籍摘要生成
为学生生成类似SparkNotes的书籍章节摘要
生成易于理解的章节概述
研究
学术论文摘要
为研究人员生成长篇论文的简明摘要
ROUGE-1得分36.2043(multi_news数据集)
法律
法律文档摘要
总结冗长的法律文件
ROUGE-1得分41.3645(billsum数据集)
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase