無料でオープンソースのultra_50g知識グラフ推論モデル - 多関係グラフリンク予測とゼロショット推論の実現

ホーム

Ultra 50g

mgalkinによって開発

ULTRAは、異なるエンティティ/関係語彙を含む任意の多関係グラフでリンク予測タスクを実行できる知識グラフ推論の基盤モデルで、ゼロショット推論とファインチューニングをサポートします。

知識グラフ

Transformers

オープンソースライセンス:MIT #知識グラフ推論 #ゼロショット学習 #マルチグラフ汎用

ダウンロード数 26

リリース時間 : 12/1/2023

モデル概要

ULTRAは、任意の知識グラフに統一された学習可能で転移可能な表現を提供し、グラフニューラルネットワークと改良版NBFNet技術を採用しています。下流グラフ固有のエンティティや関係の埋め込みを学習するのではなく、関係間の相互作用を通じて相対的な関係表現を獲得します。

モデル特徴

ゼロショット推論能力

事前学習済みULTRAモデルは、ゼロショットモードで単一グラフ向けに特別訓練された多くのSOTAモデルを上回ります。

マルチグラフ適応性

単一モデルで、異なるエンティティ/関係語彙を含む任意の多関係グラフ上でタスクを実行可能で、再訓練不要です。

統一表現学習

特定グラフの埋め込みを学習するのではなく、関係間の相互作用を通じて相対的な関係表現を獲得します。

事前学習-ファインチューニングパラダイム

事前学習モデルを直接使用してゼロショット推論を行うか、特定グラフ向けにファインチューニングして性能向上が可能です。

モデル能力

知識グラフ補完

リンク予測

マルチグラフ推論

ゼロショット学習

使用事例

知識グラフ応用

知識グラフ補完

知識グラフ内の欠損リンクを予測し、知識ネットワークを自動補完します。

50以上の知識グラフで平均性能が特別訓練されたSOTAモデルを上回る

クロスドメイン知識推論

異なる分野の知識グラフ間で転移学習と推論を行います。

🚀 ULTRA

ULTRAは知識グラフ（KG）推論のための基盤モデルです。事前学習された単一のULTRAモデルは、任意のエンティティや関係語彙を持つ任意の多関係グラフでリンク予測タスクを実行します。性能面では、50以上のKGで平均すると、事前学習された単一のULTRAモデルは、各グラフに特化して学習された多くのSOTAモデルよりも0ショット推論モードで優れています。基盤モデルの事前学習 - 微調整パラダイムに従って、事前学習されたULTRAチェックポイントを任意のグラフでゼロショット方式ですぐに実行することができ、またさらなる微調整も可能です。

🚀 クイックスタート

ULTRAは、任意のKGに対して統一的で学習可能な、転移可能な表現を提供します。内部的には、ULTRAはグラフニューラルネットワークと改良版のNBFNetを採用しています。ULTRAは、下流のグラフに特化したエンティティや関係の埋め込みを学習せず、関係間の相互作用に基づいて相対的な関係表現を取得します。

論文: https://arxiv.org/abs/2310.04562
GitHub: https://github.com/DeepGraphLearning/ULTRA

✨ 主な機能

任意の多関係グラフでリンク予測タスクを実行可能
0ショット推論モードで多くのSOTAモデルより優れた性能
事前学習 - 微調整パラダイムに対応
任意のKGに対して統一的で学習可能な、転移可能な表現を提供

📦 インストール

GitHubリポジトリのインストール手順に記載されている依存関係をインストールします。
このモデルリポジトリをクローンして、modeling.py の中の UltraForKnowledgeGraphReasoning クラスを見つけ、チェックポイントをロードします（必要なすべてのモデルコードもこのモデルリポジトリに含まれています）。

💻 使用例

基本的な使用法

from modeling import UltraForKnowledgeGraphReasoning
from ultra.datasets import CoDExSmall
from ultra.eval import test
model = UltraForKnowledgeGraphReasoning.from_pretrained("mgalkin/ultra_50g")
dataset = CoDExSmall(root="./datasets/")
test(model, mode="test", dataset=dataset, gpus=None)
# Expected results for ULTRA 50g
# mrr:      0.498
# hits@10:  0.685

高度な使用法

from transformers import AutoModel
from ultra.datasets import CoDExSmall
from ultra.eval import test
model = AutoModel.from_pretrained("mgalkin/ultra_50g", trust_remote_code=True)
dataset = CoDExSmall(root="./datasets/")
test(model, mode="test", dataset=dataset, gpus=None)
# Expected results for ULTRA 50g
# mrr:      0.498
# hits@10:  0.685

📚 ドキュメント

チェックポイント

ここでは、HuggingFace上で事前学習された3つのULTRAチェックポイント（すべて約169kパラメータ）を、事前学習データの量によって提供しています。

モデル	学習用KG
ultra_3g	3つのグラフ
ultra_4g	4つのグラフ
ultra_50g	50のグラフ

ultra_3g と ultra_4g は、githubリポジトリで報告されているPyGモデルです。
ultra_50g は、50の異なるKG（帰納的および帰結的）で100万ステップ事前学習された新しいULTRAチェックポイントで、任意の未知の下流KGでの性能を最大化するために学習されています。

性能

ultra-3gとultra-4gの平均ゼロショット性能

モデル	帰納的 (e) (18グラフ) 平均MRR	帰納的 (e) (18グラフ) 平均Hits@10	帰納的 (e,r) (23グラフ) 平均MRR	帰納的 (e,r) (23グラフ) 平均Hits@10	帰結的 (16グラフ) 平均MRR	帰結的 (16グラフ) 平均Hits@10
ULTRA (3g) PyG	0.420	0.562	0.344	0.511	0.329	0.479
ULTRA (4g) PyG	0.444	0.588	0.344	0.513	WIP	WIP
ULTRA (50g) PyG (50のKGで事前学習)	0.444	0.580	0.395	0.554	0.389	0.549