lsg - bart - base - 16384 - arxivオープンソースモデル - 長いテキストを無料で処理し、科学論文の要約生成を支援

ホーム

Lsg Bart Base 16384 Arxiv

ccdvによって開発

BARTアーキテクチャに基づく長シーケンス処理モデルで、科学論文の要約生成タスクに最適化されており、16384の長文入力をサポート

テキスト生成

Transformers

英語#長文要約 #科学論文処理 #局所的スパースグローバルアテンション

ダウンロード数 29

リリース時間 : 5/9/2022

モデル概要

このモデルは局所的-スパース-グローバルアテンション機構を採用して長シーケンスを処理し、scientific_papers arxivデータセットでファインチューニングされ、科学論文要約生成タスクに適しています

モデル特徴

長シーケンス処理能力

16384の長文入力をサポートし、完全な科学論文の処理に適しています

局所的-スパース-グローバルアテンション機構

革新的なアテンション機構の組み合わせで、長シーケンス処理の計算効率とモデル性能を効果的にバランスさせます

科学論文最適化

arxiv科学論文データセットで特別にファインチューニングされ、学術テキスト要約タスクに最適化されています

モデル能力

長文要約生成

科学論文内容理解

学術テキスト処理

使用事例

学術研究

科学論文自動要約

長編科学論文に対して簡潔で正確な要約を生成

ROUGE-1: 48.74, ROUGE-2: 20.88, ROUGE-L: 28.50

学術文献処理

長文の学術文献内容を処理・分析

🚀 ccdv/lsg-bart-base-16384-arxiv

このモデルは、scientific_papers arxiv データセット上で ccdv/lsg-bart-base-4096-arxiv をファインチューニングしたバージョンです。このモデルは、16384の長いシーケンスを扱うように変換され、1エポックで適切にファインチューニングされています。テストセットでは以下の結果を達成しています。

🚀 クイックスタート

Transformers >= 4.36.1 このモデルはカスタムモデリングファイルに依存しています。trust_remote_code=True を追加する必要があります。 詳細は #13467 を参照してください。

LSG ArXiv 論文。Githubの変換スクリプトはこのリンクから入手できます。

基本的な使用法

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, pipeline

tokenizer = AutoTokenizer.from_pretrained("ccdv/lsg-bart-base-16384-arxiv", trust_remote_code=True)
model = AutoModelForSeq2SeqLM.from_pretrained("ccdv/lsg-bart-base-16384-arxiv", trust_remote_code=True)

text = "Replace by what you want."
pipe = pipeline("text2text-generation", model=model, tokenizer=tokenizer, device=0)
generated_text = pipe(
  text, 
  truncation=True, 
  max_length=64, 
  no_repeat_ngram_size=7,
  num_beams=2,
  early_stopping=True
  )

✨ 主な機能

このモデルは、ccdv/lsg-bart-base-4096-arxiv を scientific_papers arxiv データセットでファインチューニングしたものです。16384の長いシーケンスを扱うように変換され、1エポックでファインチューニングされています。

このモデルは、以下のような結果をテストセットで達成しています。

長さ	グローバルトークン	ファインチューニング	ブロックサイズ	接続数	R1	R2	RL	RLsum
16384	64	完全	256	768	48.74	20.88	28.50	44.23
16384	1	完全	256	768	48.66	20.92	28.50	44.18
16384	64	グローバルのみ	256	768	48.08	20.42	28.00	43.65
16384	1	なし	256	768	47.03	20.19	28.26	42.69