t5_summarizer_modelオープンソーステキスト要約ツール - 長文から無料で簡潔で有益な要約を生成

ホーム

T5 Summarizer Model

KipperDevによって開発

T5-smallをファインチューニングしたテキスト要約モデルで、長文から簡潔で一貫性があり情報豊富な要約を生成するために特別に設計されています。

テキスト生成

Transformers

英語オープンソースライセンス:MIT #特許文書要約 #生成型要約 #T5ファインチューニング

ダウンロード数 25

リリース時間 : 1/10/2024

モデル概要

このモデルはT5のテキストtoテキストアプローチを活用し、テキスト要約タスクに最適化されており、詳細なレポート、研究論文、または記事の核心を素早く把握する必要がある専門家や研究者に特に適しています。

モデル特徴

T5アーキテクチャベース

T5のテキストtoテキストアプローチを利用し、テキスト要約タスクを効率的に処理できます。

専門的なファインチューニング

Big Patentデータセットを使用してファインチューニングされており、複雑な構造のドキュメント要約に適しています。

高性能な要約生成

生成された要約は人手による要約と高い一致度を示し、ROUGE指標で優れたパフォーマンスを発揮します。

モデル能力

テキスト要約生成

長文の要約

情報の凝縮

使用事例

専門文書処理

特許文書の要約

複雑な特許文書から核心情報を抽出し、簡潔な要約を生成します。

ROUGE-1スコア0.503で、要約が人手による内容と高い一致度を示しています。

研究報告の要約

長文の研究報告を迅速に要約し、研究者が核心内容を素早く把握するのを支援します。

🚀 クイックスタート

このモデルは、長文のテキストを簡潔で有益な要約にまとめるために使用されます。詳細なレポート、研究論文、または記事の全体を読まずに内容の要点を迅速に把握する必要がある専門家や研究者に特に役立ちます。

インストール

pip を使用してインストールします。

pip install transformers

使用例

from transformers import pipeline
from transformers import AutoTokenizer
from transformers import AutoModelForSeq2SeqLM

model_name = "KipperDev/t5_summarizer_model"

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
summarizer = pipeline("summarization", model=model, tokenizer=tokenizer)

# 例の使用方法
prefix = "summarize: "
input_text = "Your input text here."
input_ids = tokenizer.encode(prefix + input_text, return_tensors="pt")
summary_ids = model.generate(input_ids)
summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)

print(summary)

⚠️ 重要提示

モデルを意図通りに動作させるには、入力データの前に summarize: の接頭辞を付ける必要があります。

✨ 主な機能

このモデルは、t5-small モデルのバリアントで、テキスト要約タスクに特化して微調整されています。T5のテキスト対テキストアプローチの力を活用して、広範なテキストドキュメントから簡潔で首尾一貫した有益な要約を生成することを目的としています。

📦 インストール

pip を使用してインストールします。

pip install transformers

💻 使用例

基本的な使用法

from transformers import pipeline
from transformers import AutoTokenizer
from transformers import AutoModelForSeq2SeqLM

model_name = "KipperDev/t5_summarizer_model"

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
summarizer = pipeline("summarization", model=model, tokenizer=tokenizer)

# 例の使用方法
prefix = "summarize: "
input_text = "Your input text here."
input_ids = tokenizer.encode(prefix + input_text, return_tensors="pt")
summary_ids = model.generate(input_ids)
summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)

print(summary)

🔧 技術詳細

学習データ

このモデルは、Big Patent Dataset を使用して学習されました。このデータセットは130万件の米国特許文書とそれに対応する人間が書いた要約から構成されています。このデータセットは、豊富な言語と複雑な構造を持ち、文書要約タスクの難しさを代表しているため選ばれました。学習には、データセットの複数のサブセットが使用され、様々な文書タイプに対して幅広いカバレッジと堅牢なモデル性能を確保しました。

学習手順

学習は3ラウンドにわたって行われました。初期設定では、学習率0.00002、バッチサイズ8、エポック数4で行われました。その後のラウンドでは、それぞれ0.0003、8、12にパラメータを調整してモデル性能をさらに洗練させました。また、モデルの学習効率を経時的に向上させるために、線形減衰学習率スケジュールが適用されました。

📚 ドキュメント

学習結果

モデルの性能はROUGEメトリックを使用して評価され、人間が書いた要約に近い要約を生成する能力が示されました。

Metric	Value
Evaluation Loss (Eval Loss)	1.9984
Rouge-1	0.503
Rouge-2	0.286
Rouge-L	0.3813
Rouge-Lsum	0.3813
Average Generation Length (Gen Len)	151.918
Runtime (seconds)	714.4344
Samples per Second	2.679
Steps per Second	0.336

📄 ライセンス

このモデルはMITライセンスの下で提供されています。

📖 引用

BibTeX:

@article{kipper_t5_summarizer,
 // SOON
}

👨‍💻 作者

このモデルカードは Fernanda Kipper によって作成されました。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご