Bart-large-paper2slides-summarizerオープンソース要約モデル - 研究論文を正確にスライド内容に要約する

ホーム

Bart Large Paper2slides Summarizer

com3dianによって開発

Bart-Largeアーキテクチャに基づく要約モデルで、研究論文の内容をスライド展示に適した形式に正確に要約するために特別に設計されています。

テキスト生成

Transformers

英語オープンソースライセンス:MIT #研究論文要約 #教師なし学習 #スライド生成

ダウンロード数 26

リリース時間 : 7/10/2023

モデル概要

このモデルは教師なし学習技術を用いて、研究論文から自動生成されたスライドデータセットで微調整され、科学テキストの正確な要約に焦点を当て、拡張モデルBart-large-paper2slides-expanderと並行して訓練されています。

モデル特徴

科学テキストの正確な要約

研究論文の内容に特化して最適化され、スライド展示に適した正確な要約を生成できます。

教師なし学習による微調整

教師なし学習アルゴリズムを使用して、研究論文から自動生成されたスライドデータセットで微調整されます。

大規模モデルアーキテクチャ

Bart-Largeアーキテクチャに基づき、12層のエンコーダーとデコーダーを含み、強力なシーケンス間処理能力を持っています。

モデル能力

科学テキスト要約

スライドコンテンツ生成

長文圧縮

使用事例

学術研究

論文プレゼンテーションスライド生成

研究論文の内容を自動的に要約し、プレゼンテーションに適したスライド形式に変換します。

人工知能、数学などの複数の科学分野で人間による評価を実施

教育

教材準備

複雑な科学文献から迅速に主要な情報を抽出し、教育プレゼンテーションに利用します。

🚀 Bart-Large要約モデル

このモデルは、科学的な文章を精度よく要約することを目的としています。科学論文からの自動スライド生成データセットを用いて教師なし学習技術でファインチューニングされています。同じ貢献者によるBart-large-paper2slides-expanderと並行して訓練されています。

🚀 クイックスタート

このモデルを使うには、Hugging FaceのTransformersライブラリを利用できます。以下はPythonでの使用例です。

from transformers import BartTokenizer, BartForConditionalGeneration, pipeline

# モデルとトークナイザーをロード
model_name = "com3dian/Bart-large-paper2slides-summarizer"
tokenizer = BartTokenizer.from_pretrained(model_name)
model = BartForConditionalGeneration.from_pretrained(model_name)

# 入力テキストから要約を生成
input_text = "Your input text here..."
input_ids = tokenizer.encode(input_text, return_tensors="pt")
output = model.generate(input_ids)

# 生成された要約をデコード
summary = tokenizer.decode(output[0], skip_special_tokens=True)
print(summary)

# またはパイプラインAPIを使用
summarizer = pipeline("summarization", model=model_name)
summary = summarizer(input_text, max_length=50, min_length=30, do_sample=False)
print(summary)

コードを実行する前に、transformersライブラリがインストールされていることを確認してください。pipを使ってインストールできます。

pip install transformers

✨ 主な機能

科学的な文章を精度よく要約することができます。
教師なし学習技術を用いてファインチューニングされています。

📦 インストール

コードを実行する前に、transformersライブラリがインストールされていることを確認してください。pipを使ってインストールできます。

pip install transformers

💻 使用例

基本的な使用法

from transformers import BartTokenizer, BartForConditionalGeneration, pipeline

# モデルとトークナイザーをロード
model_name = "com3dian/Bart-large-paper2slides-summarizer"
tokenizer = BartTokenizer.from_pretrained(model_name)
model = BartForConditionalGeneration.from_pretrained(model_name)

# 入力テキストから要約を生成
input_text = "Your input text here..."
input_ids = tokenizer.encode(input_text, return_tensors="pt")
output = model.generate(input_ids)

# 生成された要約をデコード
summary = tokenizer.decode(output[0], skip_special_tokens=True)
print(summary)

# またはパイプラインAPIを使用
summarizer = pipeline("summarization", model=model_name)
summary = summarizer(input_text, max_length=50, min_length=30, do_sample=False)
print(summary)

📚 ドキュメント

モデルの詳細

プロパティ	詳細
モデルタイプ	Bart-Large
訓練データ	科学論文からの自動スライド生成データセット
ファインチューニング方法	教師なし学習

Bart (Bidirectional and Auto-Regressive Transformers) はFacebook AI Researchによって開発されたシーケンス-to-シーケンス (seq2seq) モデルです。文章の要約、文章の生成、機械翻訳など、様々な自然言語処理 (NLP) タスクで優れた性能を発揮しています。

この特定のモデルであるBart-Largeは、Bartモデルのより大きなバージョンです。12層のエンコーダとデコーダで構成され、合計4億個のパラメータを持っています。