long-t5-tglobal-large-pubmed-3k-booksum-16384-WIP15 Open-Source Summarization Model - Free for Summarizing Books and Long Documents

Long T5 Tglobal Large Pubmed 3k Booksum 16384 WIP15

Developed by pszemraj

A large-scale summarization model based on the Long-T5 architecture, specifically optimized for book and long document summarization tasks

Text Generation

Transformers

Open Source License:Bsd-3-clause #Long Text Summarization #Book Summarization #High ROUGE Scores

Downloads 17

Release Time : 9/20/2022

Model Overview

This model is a variant based on the Long-T5 architecture, specifically designed for summarization tasks involving long documents and books. It is trained on the pubmed and booksum datasets and can handle input texts up to 16,384 tokens in length.

Model Features

Long Text Processing Capability

Supports processing input texts up to 16,384 tokens, making it suitable for book and long document summarization

Domain-Specific Optimization

Specifically trained on the pubmed medical literature and booksum book summarization datasets

Multi-Dataset Performance

Evaluated on multiple summarization datasets, including samsum, booksum, and gov_report

Model Capabilities

Long text summarization generation

Book content summarization

Technical document summarization

Government report summarization

Use Cases

Academic Research

Medical Literature Summarization

Generates concise summaries for medical literature such as pubmed

ROUGE-1 score 35.33 (booksum dataset)

Publishing Industry

Book Content Summarization

Generates chapter or full-book summaries for lengthy books

Average generation length 268 tokens (booksum dataset)

Government Document Processing

Government Report Summarization

Processes lengthy government reports and generates key-point summaries

ROUGE-1 score 37.04 (gov_report dataset)

Task	Dataset	ROUGE - 1	ROUGE - 2	ROUGE - L	ROUGE - LSUM	Loss	Gen Len
Summarization	samsum	24.5482	4.811	17.2505	20.906	3.3002164363861084	52
Summarization	kmfoda/booksum	35.3305	5.8001	16.0557	32.3409	3.0063540935516357	268.4032
Summarization	launch/gov_report	37.0412	8.519	17.8685	33.5036	3.628979444503784	219.3885

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Long T5 Tglobal Large Pubmed 3k Booksum 16384 WIP15

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 long-t5-tglobal-large-pubmed-3k-booksum-16384-WIP15

📚 Documentation

Model description

Intended uses & limitations

Training and evaluation data

🔧 Technical Details

Training procedure

Training hyperparameters

Framework versions

📄 License

📊 Model Index