bart_summarizer_modelオープンソースのテキスト要約モデル - 無料で長文を簡潔かつ首尾一貫した要約に変換する

ホーム

Bart Summarizer Model

KipperDevによって開発

facebook/bart-baseをファインチューニングしたテキスト要約モデルで、長文から簡潔で一貫性のある要約を生成するのに優れています。

テキスト生成

Transformers

英語オープンソースライセンス:MIT #特許要約生成 #BARTファインチューニング #長文圧縮

ダウンロード数 30

リリース時間 : 1/25/2024

モデル概要

このモデルはBARTの双方向エンコーダーと自己回帰デコーダーアーキテクチャを活用し、テキスト要約タスクに特化して最適化されており、研究報告書、論文、記事などの長文テキストの要約生成に適しています。

モデル特徴

特許データでのファインチューニング

Big Patent Datasetを使用して訓練されており、技術的な特許文書の要約を処理できます。

プレフィックスプロンプト最適化

'summarize:'プレフィックスを追加することで、モデルの要約生成品質が大幅に向上します。

マルチラウンドトレーニング

3段階の異なるパラメータでトレーニング戦略を採用し、段階的にモデル性能を最適化します。

モデル能力

長文圧縮

技術文書要約

核心内容抽出

使用事例

専門文書処理

特許文書要約

特許文書の技術ポイントを迅速に要約生成

ROUGE-1スコア0.5007達成

研究報告書まとめ

科学研究報告書の核心的な発見と結論を抽出

コンテンツ作成支援

記事要約生成

長文ニュースやブログ記事の簡潔な要約を生成

🚀 KipperDev/bart_summarizer_model

このモデルは、テキスト要約タスクに特化して微調整されたものです。BARTの双方向エンコーダと自己回帰型デコーダを活用し、長いテキスト文書から簡潔で一貫性のある情報的な要約を生成します。

🚀 クイックスタート

このモデルは、長文のテキストを簡潔で情報的な抽象文に要約するために使用されます。詳細なレポート、研究論文、または記事の全体を読まずに内容の要点を迅速に把握する必要がある専門家や研究者に特に役立ちます。

インストール

pipを使ってインストールします。

pip install transformers

使用例

from transformers import pipeline
from transformers import AutoTokenizer
from transformers import AutoModelForSeq2SeqLM

model_name = "KipperDev/bart_summarizer_model"

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
summarizer = pipeline("summarization", model=model, tokenizer=tokenizer)

# 例の使用法
prefix = "summarize: "
input_text = "Your input text here."
input_ids = tokenizer.encode(prefix + input_text, return_tensors="pt")
summary_ids = model.generate(input_ids)
summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)

print(summary)

⚠️ 重要提示

モデルを意図通りに動作させるには、入力データの前に 'summarize:' 接頭辞を付ける必要があります。

✨ 主な機能

長文のテキストを簡潔で情報的な要約に変換します。
BARTの双方向エンコーダと自己回帰型デコーダを活用して、質の高い要約を生成します。

📦 インストール

pipを使ってtransformersライブラリをインストールします。

pip install transformers

💻 使用例

基本的な使用法

from transformers import pipeline
from transformers import AutoTokenizer
from transformers import AutoModelForSeq2SeqLM

model_name = "KipperDev/bart_summarizer_model"

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
summarizer = pipeline("summarization", model=model, tokenizer=tokenizer)

# 例の使用法
prefix = "summarize: "
input_text = "Your input text here."
input_ids = tokenizer.encode(prefix + input_text, return_tensors="pt")
summary_ids = model.generate(input_ids)
summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)

print(summary)

📚 ドキュメント

学習データ

このモデルは、Big Patent Datasetを使用して学習されました。このデータセットは130万件の米国特許文書とそれに対応する人が書いた要約で構成されています。豊富な言語と複雑な構造を持ち、文書要約タスクの難しさを代表しているため選ばれました。

学習には、データセットの複数のサブセットを使用し、様々な文書タイプに対する広範なカバレッジと堅牢なモデル性能を確保しました。

学習手順

学習は3ラウンドにわたって行われました。最初の設定では、学習率0.00002、バッチサイズ8、エポック数4で行われました。その後のラウンドでは、それぞれ0.0003、8、12にパラメータを調整してモデル性能をさらに洗練させました。また、モデルの学習効率を時間の経過とともに向上させるために、線形減衰学習率スケジュールが適用されました。

学習結果

モデルの性能はROUGEメトリックを使用して評価され、人が書いた抽象文に近い要約を生成する能力が示されました。

メトリック	値
評価損失 (Eval Loss)	1.9244
Rouge-1	0.5007
Rouge-2	0.2704
Rouge-L	0.3627
Rouge-Lsum	0.3636
平均生成長 (Gen Len)	122.1489
実行時間 (秒)	1459.3826
1秒あたりのサンプル数	1.312
1秒あたりのステップ数	0.164

📄 ライセンス

このモデルはMITライセンスの下で提供されています。

📖 引用

@article{kipper_t5_summarizer,
 // SOON
}

👥 作者

このモデルカードはFernanda Kipperによって書かれました。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご