🚀 KnowGL:从文本中进行知识生成与链接
KnowGL 模型致力于解决从文本中提取和生成知识的问题。它通过结合 Wikidata 和 REBEL 数据集中扩展版本的训练数据进行训练,能够将文本转化为结构化的三元组知识,为知识图谱的构建和应用提供了强大的支持。
✨ 主要特性
- 知识生成:给定一个句子,KnowGL 可以生成特定格式的三元组
[(subject mention # subject label # subject type) | relation label | (object mention # object label # object type)]
。若生成多个三元组,输出中会用 $
分隔。
- 链接功能:生成的主体、关系和客体的标签及其类型可直接映射到与之关联的 Wikidata ID。
- 先进性能:在 REBEL 数据集的关系抽取任务中取得了最先进的成果。
📦 安装指南
文档未提供安装步骤,故跳过此章节。
💻 使用示例
文档未提供代码示例,故跳过此章节。
📚 详细文档
模型训练
knowgl-large
模型是通过将 Wikidata 与 REBEL 数据集中扩展版本的训练数据相结合进行训练的。
输出格式
给定一个句子,KnowGL 生成的三元组格式如下:
[(subject mention # subject label # subject type) | relation label | (object mention # object label # object type)]
若生成多个三元组,输出中用 $
分隔。更多详细信息可参考 Rossiello et al. (AAAI 2023)。
模型性能
该模型在 REBEL 数据集的关系抽取任务中取得了最先进的成果,具体结果可参考 Mihindukulasooriya et al. (ISWC 2022)。
映射功能
生成的主体、关系和客体的标签及其类型可直接映射到与之关联的 Wikidata ID。
信息表格
属性 |
详情 |
模型类型 |
知识生成与链接模型 |
训练数据 |
Wikidata 与 REBEL 数据集中扩展版本的训练数据 |
🔧 技术细节
文档未提供技术实现细节,故跳过此章节。
📄 许可证
本项目采用 cc-by-nc-sa-4.0
许可证。
引用信息
@inproceedings{DBLP:conf/aaai/RossielloCMCG23,
author = {Gaetano Rossiello and
Md. Faisal Mahbub Chowdhury and
Nandana Mihindukulasooriya and
Owen Cornec and
Alfio Massimiliano Gliozzo},
title = {KnowGL: Knowledge Generation and Linking from Text},
booktitle = {{AAAI}},
pages = {16476--16478},
publisher = {{AAAI} Press},
year = {2023}
}
@inproceedings{DBLP:conf/semweb/Mihindukulasooriya22,
author = {Nandana Mihindukulasooriya and
Mike Sava and
Gaetano Rossiello and
Md. Faisal Mahbub Chowdhury and
Irene Yachbes and
Aditya Gidh and
Jillian Duckwitz and
Kovit Nisar and
Michael Santos and
Alfio Gliozzo},
title = {Knowledge Graph Induction Enabling Recommending and Trend Analysis:
{A} Corporate Research Community Use Case},
booktitle = {{ISWC}},
series = {Lecture Notes in Computer Science},
volume = {13489},
pages = {827--844},
publisher = {Springer},
year = {2022}
}