long-t5-tglobal-base-16384-booksum-V11-big_patent-V2オープンソースモデル - 書籍やドキュメントの長文要約を簡単に処理

ホーム

Long T5 Tglobal Base 16384 Booksum V11 Big Patent V2

pszemrajによって開発

T5アーキテクチャに基づく長文書要約生成モデルで、最大16384トークンの入力を処理可能、書籍や技術文書の要約タスクに適しています。

テキスト生成

Transformers

オープンソースライセンス:Bsd-3-clause #長文書要約 #技術文書処理 #16384長文テキスト

ダウンロード数 21

リリース時間 : 7/31/2022

モデル概要

このモデルはT5アーキテクチャを最適化した長文書要約生成モデルで、特に書籍や技術文書の要約タスク向けに訓練されています。最大16384トークンの入力シーケンスを処理可能で、書籍の章や技術特許などの長文書から簡潔な要約を生成するのに適しています。

モデル特徴

超長文コンテキスト処理

最大16384トークンの入力シーケンスを処理可能で、書籍などの長文書要約に適しています

複数分野への適応

書籍要約(kmfoda/booksum)と技術特許(big_patent)データセットで同時に訓練されています

効率的なアテンション機構

TGlobalアテンション変種を採用し、長文シーケンス処理の効率を最適化しています

モデル能力

長文書要約生成

書籍章要約

技術文書要約

内容濃縮

使用事例

出版と教育

書籍章要約

書籍の章に対して簡潔な内容要約を生成

booksumデータセットでROUGE-1スコア23.14

技術文書処理

特許文書要約

技術特許文書のキーコンテンツ要約を生成

big_patentデータセットで訓練最適化

🚀 pszemraj/long - t5 - tglobal - base - 16384 - booksum - V11 - big_patent - V2

このモデルは、長文の要約タスクに特化しており、Transformerベースのアーキテクチャを利用し、長いシーケンスを効率的に処理できます。大規模なデータセットで訓練され、高いROUGEスコアを達成しています。

✨ 主な機能

長文要約: 大規模な文書や書籍の要約に適しています。
低コスト処理: ブロックスパースアテンションを使用し、長いシーケンスを低コストで処理できます。
高精度: 高いROUGEスコアを達成しています。

📦 インストール

インストールに関する具体的な手順は提供されていません。

💻 使用例

基本的な使用法

# コード例は提供されていませんが、一般的な要約タスクでの使用イメージ
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer

model_name = "pszemraj/long-t5-tglobal-base-16384-booksum-V11-big_patent-V2"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)

input_text = "大規模な地震は、破裂のための歪みエネルギーを蓄積するのに時間がかかるため、一定の断層セグメントに沿ってランダムな間隔で発生するわけではありません。"
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model.generate(**inputs)
summary = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(summary)

📚 ドキュメント

パラメータ

属性	详情
最大長	64
最小長	8
繰り返し禁止n-gramサイズ	3
早期終了	true
繰り返しペナルティ	3.5
長さペナルティ	0.3
エンコーダ繰り返し禁止n-gramサイズ	3
ビーム数	4