long-t5-tglobal-large-pubmed-3k-booksum-16384-WIP15開源摘要模型

首頁

Long T5 Tglobal Large Pubmed 3k Booksum 16384 WIP15

由pszemraj開發

基於Long-T5架構的大規模摘要生成模型，專門針對書籍和長文檔摘要任務進行優化

文本生成

Transformers

開源協議:Bsd-3-clause #長文本摘要 #書籍摘要生成 #高ROUGE得分

下載量 17

發布時間 : 9/20/2022

模型概述

該模型是基於Long-T5架構的變體，專門用於處理長文檔和書籍的摘要生成任務。它在pubmed和booksum數據集上進行訓練，能夠處理長達16384個token的輸入文本。

模型特點

長文本處理能力

支持處理長達16384個token的輸入文本，適合書籍和長文檔摘要

專業領域優化

在pubmed醫學文獻和booksum書籍摘要數據集上進行了專門訓練

多數據集表現

在多個摘要數據集上進行了評估，包括samsum、booksum和gov_report

模型能力

長文本摘要生成

書籍內容摘要

技術文檔摘要

政府報告摘要

使用案例

學術研究

醫學文獻摘要

為pubmed等醫學文獻生成簡潔摘要

ROUGE-1得分35.33(booksum數據集)

出版行業

書籍內容摘要

為長篇書籍生成章節或全書摘要

平均生成長度268個token(booksum數據集)

政府文檔處理

政府報告摘要

處理長篇政府報告並生成關鍵點摘要

ROUGE-1得分37.04(gov_report數據集)

屬性	詳情
模型類型	文本摘要模型
訓練數據	kmfoda/booksum
評估指標	ROUGE
基礎模型	pszemraj/long-t5-tglobal-large-pubmed-3k-booksum-16384-WIP13

指標	值
ROUGE-1	24.5482
ROUGE-2	4.811
ROUGE-L	17.2505
ROUGE-LSUM	20.906
損失值	3.3002164363861084
生成長度	52

指標	值
ROUGE-1	35.3305
ROUGE-2	5.8001
ROUGE-L	16.0557
ROUGE-LSUM	32.3409
損失值	3.0063540935516357
生成長度	268.4032

指標	值
ROUGE-1	37.0412
ROUGE-2	8.519
ROUGE-L	17.8685
ROUGE-LSUM	33.5036
損失值	3.628979444503784
生成長度	219.3885

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Long T5 Tglobal Large Pubmed 3k Booksum 16384 WIP15

模型概述

模型特點

模型能力

使用案例

🚀 long-t5-tglobal-large-pubmed-3k-booksum-16384-WIP15

📚 詳細文檔

模型信息

模型評估結果

samsum 數據集

kmfoda/booksum 數據集

launch/gov_report 數據集

訓練過程

訓練超參數

框架版本

📄 許可證