luke-baseオープンソース事前学習モデル - 単語とエンティティに深層コンテキスト表現を提供

ホーム

Luke Base

studio-ousiaによって開発

LUKEはTransformerベースの事前学習モデルで、単語とエンティティに特化して設計されており、エンティティ認識型の自己注意機構を通じて深い文脈表現を提供します。

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #エンティティ認識アテンション #マルチタスクNLP #知識拡張表現

ダウンロード数 2,358

リリース時間 : 3/2/2022

モデル概要

LUKEはテキスト中の単語とエンティティを独立したトークンとして扱い、それらの文脈依存表現を出力します。このモデルはエンティティ認識型の自己注意機構を採用しており、Transformerの自己注意機構を拡張し、注意スコアを計算する際にトークンのタイプ（単語またはエンティティ）を考慮します。

モデル特徴

エンティティ認識型自己注意機構

Transformerの自己注意機構を拡張し、注意スコアを計算する際にトークンのタイプ（単語またはエンティティ）を考慮します。

深い文脈表現

単語とエンティティに対して文脈依存の表現を提供し、様々なNLPタスクに適用可能です。

マルチタスクサポート

固有表現認識、エンティティタイプアノテーション、関係分類、質問応答システムなど、複数のタスクで優れた性能を発揮します。

モデル能力

固有表現認識

エンティティタイプアノテーション

関係分類

質問応答システム

使用事例

自然言語処理

固有表現認識

テキスト中の固有表現（人名、地名、組織名など）を識別します。

CoNLL-2003データセットでF1スコア94.3を達成し、従来の最高スコア93.5を上回りました。

関係分類

エンティティ間の関係を識別します。

TACREDデータセットでF1スコア72.7を達成し、従来の最高スコア72.0を上回りました。

質問応答システム

テキストに基づく質問に回答します。

SQuAD v1.1データセットでEM/F1スコア90.2/95.4を達成し、従来の最高スコア89.9/95.1を上回りました。

🚀 LUKE：エンティティ認識型自己注意機構に基づく深層コンテキストエンティティ表現

LUKE（Knowledge-based Embeddingsを用いた言語理解、Language Understanding with Knowledge-based Embeddings）は、Transformerに基づく全く新しい事前学習済みの単語とエンティティのコンテキスト表現モデルです。LUKEは、与えられたテキスト中の単語とエンティティを独立したトークンとして扱い、それらのコンテキスト表現を出力します。これは、Transformerの自己注意機構を拡張したエンティティ認識型自己注意機構を採用しており、注意スコアを計算する際にトークンのタイプ（単語またはエンティティ）を考慮します。

LUKEは、SQuAD v1.1（抽出型質問応答）、CoNLL - 2003（固有表現認識）、ReCoRD（穴埋め式質問応答）、TACRED（関係分類）、Open Entity（エンティティタイプ分類）といった、5つの人気の自然言語処理ベンチマークで最先端の結果を達成しています。

詳細情報と更新については、公式リポジトリをご覧ください。

これはLUKEのベースモデルで、12の隠れ層を持ち、隠れ層のサイズは768です。このモデルの総パラメータ数は2億5300万です。このモデルは、2018年12月版のウィキペディアを使用して学習されています。

✨ 主な機能

エンティティ認識型自己注意機構を採用し、注意スコアの計算時にトークンタイプを考慮する。
複数の自然言語処理ベンチマークで最先端の結果を達成した。

📚 ドキュメント

実験結果

実験結果は以下の通りです：

タスク	データセット	指標	LUKE-large	luke-base	以前の最高結果
抽出型質問応答	SQuAD v1.1	EM/F1	90.2/95.4	86.1/92.3	89.9/95.1 (Yang ら, 2019)
固有表現認識	CoNLL - 2003	F1	94.3	93.3	93.5 (Baevski ら, 2019)
穴埋め式質問応答	ReCoRD	EM/F1	90.6/91.2	-	83.1/83.7 (Li ら, 2019)
関係分類	TACRED	F1	72.7	-	72.0 (Wang ら, 2020)
細粒度エンティティタイプ分類	Open Entity	F1	78.2	-	77.6 (Wang ら, 2020)

引用

もしLUKEがあなたの研究に役立った場合、以下の論文を引用してください：

@inproceedings{yamada2020luke,
  title={LUKE: Deep Contextualized Entity Representations with Entity-aware Self-attention},
  author={Ikuya Yamada and Akari Asai and Hiroyuki Shindo and Hideaki Takeda and Yuji Matsumoto},
  booktitle={EMNLP},
  year={2020}
}