long-t5-tglobal-xl-16384-book-summaryオープンソースモデル - SparkNotes風の長文要約を無料で生成

ホーム

Long T5 Tglobal Xl 16384 Book Summary

pszemrajによって開発

BookSumデータセットでファインチューニングされたLongT5-XLモデルで、長文要約に特化しており、SparkNotesのような要約を生成できます。

テキスト生成

Transformers

オープンソースライセンス:Bsd-3-clause #長文要約 #書籍要約 #高精度生成

ダウンロード数 58

リリース時間 : 11/27/2022

モデル概要

このモデルはkmfoda/booksumデータセットでファインチューニングされており、学術的および物語的なテキストの処理に優れ、高品質な要約内容を生成できます。

モデル特徴

長文処理能力

最大16384トークンの入力テキストをサポートし、書籍の章などの長文ドキュメントの処理に適しています。

高品質な要約

人間の評価観点から、XLチェックポイントはより良い要約内容を生成できます。

多分野への適用性

学術的および物語的なテキストに対して優れた汎化能力を持っています。

LLM.int8量子化サポート

8ビット量子化をサポートし、メモリ使用量を大幅に削減しながら要約品質を維持します。

モデル能力

長文要約

書籍の章の要約

学術論文の要約

法律文書の要約

使用事例

教育

書籍要約生成

学生向けにSparkNotesのような書籍の章の要約を生成

理解しやすい章の概要を生成

研究

学術論文の要約

研究者向けに長編論文の簡潔な要約を生成

ROUGE-1スコア36.2043（multi_newsデータセット）

法律

法律文書の要約

冗長な法律文書を要約

ROUGE-1スコア41.3645（billsumデータセット）

🚀 long-t5-tglobal-xl + BookSum

このモデルは、長いテキストを要約し、あらゆるトピックについてSparkNotesのような要約を生成することができます。学術的なテキストや物語的なテキストにも適用でき、XLチェックポイントを使用することで、より質の高い要約を生成します。

⚠️ 重要提示

このディスカッションによると、long-t5モデルのバージョンが4.23.0以上の場合に問題が発生することがわかりました。このモデルを正常に動作させるためには、pip install transformers==4.22.0 を使用してください。

📄 ライセンス

apache-2.0
bsd-3-clause

🔍 タグ

summarization
summary
booksum
long-document
long-form
tglobal-xl
XL

📊 データセット

kmfoda/booksum

📈 評価指標

rouge

🤖 推論設定

推論はサポートされていません。

📋 モデル情報

モデル名: pszemraj/long-t5-tglobal-xl-16384-book-summary
評価結果:
- タスク: 要約
- データセット: multi_news、billsum、ccdv/arxiv-summarization
- 評価指標: ROUGE-1、ROUGE-2、ROUGE-L、ROUGE-LSUM、loss、gen_len

🚀 クイックスタート

このモデルを使用するには、まず必要なパッケージをインストールします。

pip install -U transformers

次に、以下のコードを使用してテキストを要約します。

import torch
from transformers import pipeline

summarizer = pipeline(
    "summarization",
    "pszemraj/long-t5-tglobal-xl-16384-book-summary",
    device=0 if torch.cuda.is_available() else -1,
)
long_text = "Here is a lot of text I don't want to read. Replace me"

result = summarizer(long_text)
print(result[0]["summary_text"])

✨ 主な機能

長いテキストを要約し、SparkNotesのような要約を生成します。
学術的なテキストや物語的なテキストにも適用できます。
XLチェックポイントを使用することで、より質の高い要約を生成します。

📦 インストール

必要なパッケージをインストールするには、以下のコマンドを実行します。

pip install -U transformers

💻 使用例

基本的な使用法

import torch
from transformers import pipeline

summarizer = pipeline(
    "summarization",
    "pszemraj/long-t5-tglobal-xl-16384-book-summary",
    device=0 if torch.cuda.is_available() else -1,
)
long_text = "Here is a lot of text I don't want to read. Replace me"

result = summarizer(long_text)
print(result[0]["summary_text"])

高度な使用法

パラメータの調整

summarizer を呼び出す際に、beam search textgenに関連する他のパラメータを渡すことで、さらに高品質な結果を得ることができます。

LLM.int8量子化

このPR により、long-t5 モデルでLLM.int8がサポートされるようになりました。

pip install -U transformers bitsandbytes accelerate

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

tokenizer = AutoTokenizer.from_pretrained(
    "pszemraj/long-t5-tglobal-xl-16384-book-summary"
)

model = AutoModelForSeq2SeqLM.from_pretrained(
    "pszemraj/long-t5-tglobal-xl-16384-book-summary",
    load_in_8bit=True,
    device_map="auto",
)

📚 ドキュメント

説明

このモデルは、google/long-t5-tglobal-xl を kmfoda/booksum データセットでファインチューニングしたものです。詳細については、LongT5: Efficient Text-To-Text Transformer for Long Sequences を参照してください。

意図された用途と制限

このモデルは事実の一貫性を向上させるように見えますが、要約を完全に信頼することは避け、不自然な部分は確認することをお勧めします。特に、否定文に注意してください。

学習と評価データ

kmfoda/booksum データセットを使用して学習および評価を行いました。詳細については、元の論文を参照してください。

評価結果

評価セットでの結果は以下の通りです。

eval_loss: 1.2756
eval_rouge1: 41.8013
eval_rouge2: 12.0895
eval_rougeL: 21.6007
eval_rougeLsum: 39.5382
eval_gen_len: 387.2945
eval_runtime: 13908.4995
eval_samples_per_second: 0.107
eval_steps_per_second: 0.027

FAQ

CPUで推論を実行するにはどうすればよいですか？

CPUで推論を実行する方法については、詳細な説明はありません。

非常に長い（30kトークン以上）ドキュメントをバッチで推論するにはどうすればよいですか？

このコードの summarize.py を参照してください。

さらにファインチューニングするにはどうすればよいですか？

スクリプトでの学習および要約スクリプトを参照してください。

このモデルを実行する簡単な方法はありますか？

textsum パッケージを使用することで、数行のコードでモデルをロードしてテキストを要約することができます。

pip install textsum

from textsum.summarize import Summarizer

summarizer = Summarizer(
    model_name_or_path="pszemraj/long-t5-tglobal-xl-16384-book-summary"
)

long_string = "This is a long string of text that will be summarized."
out_str = summarizer.summarize_string(long_string)
print(f"summary: {out_str}")