免费开源的ultra_50g知识图谱推理模型 - 实现多关系图链接预测与零样本推理

首页

Ultra 50g

由 mgalkin 开发

ULTRA 是一个面向知识图谱推理的基础模型，能够在任意包含不同实体/关系词汇的多关系图上执行链接预测任务，支持零样本推理和微调。

知识图谱

Transformers

开源协议:MIT #知识图谱推理 #零样本学习 #多图谱通用

下载量 26

发布时间 : 12/1/2023

模型简介

ULTRA 为任意知识图谱提供统一、可学习、可迁移的表示，采用图神经网络和改进版NBFNet技术，不学习下游图谱特定的实体和关系嵌入，而是通过关系间的交互获得相对关系表示。

模型特点

零样本推理能力

预训练的ULTRA模型在零样本模式下优于许多针对单一图谱专门训练的SOTA模型。

多图谱适应性

单个模型可在任意包含不同实体/关系词汇的多关系图上执行任务，无需重新训练。

统一表示学习

通过关系间的交互获得相对关系表示，而非学习特定图谱的嵌入。

预训练-微调范式

支持直接使用预训练模型进行零样本推理，也可针对特定图谱进行微调以获得更好性能。

模型能力

知识图谱补全

链接预测

多图谱推理

零样本学习

使用案例

知识图谱应用

知识图谱补全

预测知识图谱中缺失的链接，自动补全知识网络。

在50+个知识图谱上平均性能优于专门训练的SOTA模型

跨领域知识推理

在不同领域的知识图谱间进行迁移学习和推理。

🚀 ULTRA - 知识图谱推理基础模型

ULTRA是用于知识图谱（KG）推理的基础模型。一个预训练的ULTRA模型可以在任何具有任意实体/关系词汇表的多关系图上执行链接预测任务。在性能方面，在50多个知识图谱上进行平均，一个预训练的ULTRA模型在零样本推理模式下比许多专门针对每个图训练的SOTA模型表现更好。遵循基础模型的预训练 - 微调范式，你可以在任何图上立即以零样本方式运行预训练的ULTRA检查点，也可以进行更多微调。

ULTRA为任何知识图谱提供统一、可学习、可迁移的表示。在底层，ULTRA采用图神经网络和改进版的NBFNet。ULTRA不会学习特定于下游图的任何实体和关系嵌入，而是基于关系之间的交互获得相对关系表示。

论文链接：https://arxiv.org/abs/2310.04562
GitHub链接：https://github.com/DeepGraphLearning/ULTRA

🚀 快速开始

按照以下步骤使用ULTRA模型：

安装依赖，具体依赖列表请参考GitHub仓库中的安装说明。
克隆此模型仓库，在modeling.py中找到UltraForKnowledgeGraphReasoning类并加载检查点（所有必要的模型代码也在此模型仓库中）。

✨ 主要特性

通用性：单个预训练的ULTRA模型可在任何多关系图上执行链接预测任务，无需针对特定图进行专门训练。
高性能：在零样本推理模式下，平均在50多个知识图谱上的表现优于许多专门针对每个图训练的SOTA模型。
可迁移性：提供统一、可学习、可迁移的知识图谱表示，基于关系之间的交互获得相对关系表示。

📦 安装指南

安装依赖，具体依赖列表请参考GitHub仓库中的安装说明。

💻 使用示例

基础用法

在任何图上运行零样本推理：

from modeling import UltraForKnowledgeGraphReasoning
from ultra.datasets import CoDExSmall
from ultra.eval import test
model = UltraForKnowledgeGraphReasoning.from_pretrained("mgalkin/ultra_50g")
dataset = CoDExSmall(root="./datasets/")
test(model, mode="test", dataset=dataset, gpus=None)
# ULTRA 50g的预期结果
# mrr:      0.498
# hits@10:  0.685

高级用法

使用AutoModel进行零样本推理：

from transformers import AutoModel
from ultra.datasets import CoDExSmall
from ultra.eval import test
model = AutoModel.from_pretrained("mgalkin/ultra_50g", trust_remote_code=True)
dataset = CoDExSmall(root="./datasets/")
test(model, mode="test", dataset=dataset, gpus=None)
# ULTRA 50g的预期结果
# mrr:      0.498
# hits@10:  0.685

你还可以在每个图上对ULTRA进行微调，有关训练/微调的更多详细信息，请参考GitHub仓库。模型代码包含57个不同的知识图谱，有关可用图谱的更多详细信息，请参考GitHub仓库。

📚 详细文档

检查点

在HuggingFace上，我们提供3个预训练的ULTRA检查点（所有约169k参数），这些检查点根据预训练数据的数量而有所不同。

模型	训练知识图谱
ultra_3g	3个图
ultra_4g	4个图
ultra_50g	50个图

ultra_3g和ultra_4g是GitHub仓库中报告的PyG模型；
ultra_50g是一个新的ULTRA检查点，在50个不同的知识图谱（归纳和直推）上预训练了100万步，以在任何未见的下游知识图谱上实现最佳性能。

性能

ultra - 3g和ultra - 4g的平均零样本性能

模型	归纳（e）（18个图）平均MRR	归纳（e）（18个图）平均Hits@10	归纳（e,r）（23个图）平均MRR	归纳（e,r）（23个图）平均Hits@10	直推（16个图）平均MRR	直推（16个图）平均Hits@10
ULTRA (3g) PyG	0.420	0.562	0.344	0.511	0.329	0.479
ULTRA (4g) PyG	0.444	0.588	0.344	0.513	WIP	WIP
ULTRA (50g) PyG（在50个知识图谱上预训练）	0.444	0.580	0.395	0.554	0.389	0.549