long-t5-tglobal-baseオープンソーステキスト変換モデル - 長いシーケンスのテキスト内容を効率的に処理する

ホーム

Long T5 Tglobal Base

googleによって開発

LongT5はT5アーキテクチャに基づくテキスト間変換モデルで、一時的グローバル注意機構を採用し長いシーケンス入力を効率的に処理します

大規模言語モデル英語オープンソースライセンス:Apache-2.0 #長文処理 #効率的な注意機構 #テキスト生成

ダウンロード数 71.38k

リリース時間 : 4/16/2022

モデル概要

LongT5はエンコーダ-デコーダアーキテクチャのTransformerモデルで、局所的注意または一時的-グローバル注意機構により長いシーケンス（最大16,384トークン）を効率的に処理し、特に長文処理が必要な生成タスクに適しています

モデル特徴

長シーケンス処理能力

最大16,384トークンの長いシーケンス入力をサポートし、スパース注意機構により効率的に処理します

一時的グローバル注意

革新的な一時的-グローバル注意機構を採用し、性能を維持しながら計算複雑性を低減します

生成的事前学習

Pegasusのような生成的ノイズ除去事前学習方法を使用し、テキスト生成能力を最適化します

モデル能力

長文要約生成

長文書質問応答システム

テキスト間変換

使用事例

テキスト要約

長文書自動要約

研究論文、法律文書などの長文書から簡潔な要約を生成します

長文要約タスクで優れた性能を発揮します

質問応答システム

長文書質問応答

長文書から情報を抽出し複雑な質問に回答します

🚀 LongT5 (transient-global attention, base-sized model)

LongT5は英語で事前学習されたモデルです。このモデルは、Guoらによる論文 LongT5: Efficient Text-To-Text Transformer for Long Sequences で紹介され、the LongT5 repository で最初に公開されました。モデルのアーキテクチャと設定のすべては、Googleの別の研究プロジェクトリポジトリ T5x を使用する Flaxformer repository で見つけることができます。

免責事項: LongT5を公開したチームはこのモデルのモデルカードを作成していないため、このモデルカードはHugging Faceチームによって作成されました。

🚀 クイックスタート

LongT5モデルは、テキストからテキストへのノイズ除去生成設定（Pegasusのような生成事前学習）で事前学習されたエンコーダ-デコーダトランスフォーマーです。LongT5モデルは T5モデルの拡張であり、2つの異なる効率的な注意機構のうちの1つを使用できます - (1) ローカル注意、または (2) トランジェント-グローバル注意。注意の疎性パターンの使用により、モデルは入力シーケンスを効率的に処理できます。

LongT5は、長い入力シーケンス（最大16,384トークン）を処理する必要があるテキスト生成（要約、質問応答）に微調整された場合に特に効果的です。

✨ 主な機能

このモデルは主に、教師付きデータセットで微調整することを目的としています。あなたが興味のあるタスクで微調整されたバージョンを探すには、モデルハブを参照してください。

💻 使用例

基本的な使用法

from transformers import AutoTokenizer, LongT5Model

tokenizer = AutoTokenizer.from_pretrained("google/long-t5-tglobal-base")
model = LongT5Model.from_pretrained("google/long-t5-tglobal-base")

inputs = tokenizer("Hello, my dog is cute", return_tensors="pt")
outputs = model(**inputs)

last_hidden_states = outputs.last_hidden_state

📚 ドキュメント

BibTeXエントリと引用情報

@article{guo2021longt5,
  title={LongT5: Efficient Text-To-Text Transformer for Long Sequences},
  author={Guo, Mandy and Ainslie, Joshua and Uthus, David and Ontanon, Santiago and Ni, Jianmo and Sung, Yun-Hsuan and Yang, Yinfei},
  journal={arXiv preprint arXiv:2112.07916},
  year={2021}
}