TriviaQA-T5ベースのオープンソース雑学質問応答モデル - コンテキストなしでのトレーニングによるクローズドブック形式の質問応答の実現

ホーム

Triviaqa T5 Base

deep-learning-analyticsによって開発

T5-baseアーキテクチャに基づくトリビアQAモデル。コンテキスト不要のトレーニングでクローズドブックQA能力を実現

質問応答システム

Transformers

英語#クローズドブックQA #T5アーキテクチャ #トリビア知識ベース

ダウンロード数 79

リリース時間 : 3/2/2022

モデル概要

このモデルはトリビア質問向けに設計され、記憶ベースから回答を検索・返答。事実質問への迅速な回答が必要な場面に適応

モデル特徴

クローズドブックQA能力

コンテキスト不要で直接トリビア質問に回答可能

効率的なトレーニング

135トレーニングエポックと簡潔な入出力長設定を採用

軽量デプロイ

T5-baseアーキテクチャベースでリソース制限環境に適応

モデル能力

事実質問回答

短文生成

知識検索

使用事例

エンターテインメントアプリ

トリビアクイズゲーム

クイズゲーム構築用バックエンドエンジンとして利用

約70%の簡単なトリビア質問を処理可能

インテリジェントカスタマーサポート基礎モジュール

一般的な事実質問を処理

🚀 クローズドブックトリビアQA T5ベース

このモデルは、コンテキストなしのトリビアQAデータセットで学習されたT5ベースモデルです。トリビアタイプの質問に対して、モデル内のメモリを検索して回答を返します。

🚀 クイックスタート

このモデルは、No Context Trivia QAデータセットで学習されたT5ベースモデルです。モデルの入力はトリビアタイプの質問で、モデルはそのメモリ内を検索して回答を返すように調整されています。ここで使用される事前学習モデルは、Common Crawl (C4)データセットで学習されています。モデルはバッチサイズ32、学習率1e - 3で135エポック学習されました。max_input_lngthは25、max_output_lengthは10に設定されています。モデルはEMスコア17、Subset Matchスコア24.5を達成しています。学習手順についてのブログ記事を書いています。こちらから確認できます。

以下のウェブサイトのトリビア質問でモデルをテストしてみてください。 https://www.triviaquestionss.com/easy-trivia-questions/ https://laffgaff.com/easy-trivia-questions-and-answers/

✨ 主な機能

トリビアタイプの質問に対して、コンテキストなしで回答を返すことができます。
事前学習モデルはCommon Crawl (C4)データセットで学習されています。

📦 インストール

このモデルを使用するには、transformersライブラリが必要です。以下のコマンドでインストールできます。

pip install transformers

💻 使用例

基本的な使用法

from transformers import AutoTokenizer, AutoModelWithLMHead

tokenizer = AutoTokenizer.from_pretrained("deep-learning-analytics/triviaqa-t5-base")
model = AutoModelWithLMHead.from_pretrained("deep-learning-analytics/triviaqa-t5-base")

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
model = model.to(device)

text = "Who directed the movie Jaws?"

preprocess_text = text.strip().replace("\n","")
tokenized_text = tokenizer.encode(preprocess_text, return_tensors="pt").to(device)

outs = model.model.generate(
            tokenized_text,
            max_length=10,
            num_beams=2,
            early_stopping=True
           )

dec = [tokenizer.decode(ids) for ids in outs]
print("Predicted Answer: ", dec)

📚 ドキュメント

モデルの詳細

モデルタイプ：T5-base
学習データ：No Context Trivia QAデータセット、事前学習にはCommon Crawl (C4)データセット
学習パラメータ：バッチサイズ32、学習率1e - 3、エポック数135
入出力長：max_input_lngth = 25、max_output_length = 10
評価指標：EMスコア17、Subset Matchスコア24.5

学習手順

学習手順についての詳細は、こちらのブログ記事を参照してください。

テストサイト

以下のウェブサイトのトリビア質問でモデルをテストできます。

https://www.triviaquestionss.com/easy-trivia-questions/
https://laffgaff.com/easy-trivia-questions-and-answers/

🔧 技術詳細

このモデルはT5-baseアーキテクチャを使用しています。T5は、テキスト生成タスクに適したトランスフォーマーベースのモデルです。このモデルは、No Context Trivia QAデータセットで微調整されており、トリビア質問に対してコンテキストなしで回答を生成するように訓練されています。事前学習モデルはCommon Crawl (C4)データセットで学習されており、広範な言語知識を持っています。学習時には、バッチサイズ32、学習率1e - 3で135エポック学習されました。入出力長はそれぞれ25と10に設定されています。評価指標として、EMスコアとSubset Matchスコアが使用されています。