t5-large-ssmオープンソースのクローズドブックQ&Aモデル

ホーム

T5 Large Ssm

googleによって開発

T5アーキテクチャに基づく閉卷式質問応答モデルで、事前学習と増分学習により外部知識源を必要としない質問応答能力を実現します。

大規模言語モデル英語オープンソースライセンス:Apache-2.0 #闭卷式質問応答 #知識の内面化 #無検索質問応答

ダウンロード数 75

リリース時間 : 3/2/2022

モデル概要

このモデルはT5アーキテクチャを採用し、まずC4データセットで事前学習を行い、次にウィキペディアで増分学習を行い、閉卷式質問応答タスクに特化しています。下流タスクで微調整する必要があります。

モデル特徴

閉卷式質問応答能力

外部知識源やコンテキストに依存せず、直接モデルパラメータから知識を検索して質問に答えます。

二段階学習

まずC4データセットで標準的なノイズ除去事前学習を行い、次にウィキペディアで顕著な断片マスク増分学習を行います。

拡張性

研究によると、モデルの性能は規模の拡大とともに向上し、オープンドメイン質問応答システムと同等の性能を発揮します。

モデル能力

知識検索

質問応答生成

テキスト理解

使用事例

教育

知識質問応答システム

外部知識ベースにアクセスする必要のないインテリジェント質問応答システムを構築します。

検索に依存するオープンドメインシステムと同等の性能を発揮します。

研究

知識封入研究

言語モデルのパラメータに封入された知識量を研究します。

モデルパラメータが知識を効果的に保存および検索できることを検証しました。

🚀 GoogleのT5によるクローズドブック質問応答

このモデルは、クローズドブック質問応答（Closed Book Question Answering）を目的としたものです。外部のコンテキストや知識源にアクセスすることなく、事前学習されたモデルを用いて質問に回答するアプローチを採用しています。

🚀 クイックスタート

このモデルは、クローズドブック質問応答に使用する前に、質問応答の下流タスクでファインチューニングする必要があります。

✨ 主な機能

事前学習には、T5のノイズ除去目的関数をC4で使用し、その後REALMの顕著なスパンマスキング目的関数をWikipediaで追加学習しました。
事前学習された言語モデルを用いて、外部の知識源にアクセスすることなく質問に回答することができます。
モデルサイズが大きくなるにつれて性能が向上し、外部の知識源から明示的に回答を取得するオープンドメインシステムと競合するレベルの性能を発揮します。

📦 インストール

READMEに具体的なインストール手順が記載されていないため、このセクションをスキップします。

💻 使用例

READMEに具体的なコード例が記載されていないため、このセクションをスキップします。

📚 ドキュメント

概要

最近の研究では、非構造化テキストで学習されたニューラル言語モデルが、自然言語クエリを使用して暗黙的に知識を保存および取得できることが観察されています。この短い論文では、外部のコンテキストや知識にアクセスすることなく、事前学習されたモデルをファインチューニングして質問に回答するこのアプローチの実用的な有用性を測定します。我々は、このアプローチがモデルサイズに応じてスケーリングし、質問に回答する際に外部の知識源から明示的に回答を取得するオープンドメインシステムと競合する性能を発揮することを示します。再現性と将来の研究を容易にするために、コードと学習済みモデルをhttps://goo.gle/t5 - cbqa で公開しています。