LinkBERT-large开源模型 - 增强跨文档知识理解，免费助力文档阅读分析

首页

Linkbert Large

由 michiyasunaga 开发

LinkBERT-large是基于英文维基百科及书籍语料库预训练的改进型BERT模型，通过整合文档链接信息增强跨文档知识理解能力。

大型语言模型

Transformers

英语开源协议:Apache-2.0 #跨文档理解 #知识增强预训练 #超链接感知

下载量 2,042

发布时间 : 3/8/2022

模型简介

该模型通过捕捉文档间超链接关系改进传统BERT架构，在知识密集型任务（如问答系统）和跨文档任务中表现优异，可直接替代BERT使用。

模型特点

跨文档链接建模

创新性地将关联文档纳入预训练上下文，通过超链接捕捉跨文档知识关系

知识增强表示

在维基百科结构化数据上训练，生成富含实体关系的文本嵌入

兼容BERT生态

可直接替换现有BERT模型，无需修改下游任务架构

模型能力

文本特征提取

掩码语言建模

问答系统构建

文本分类

序列标记

使用案例

知识密集型任务

开放域问答

处理需要跨文档知识的复杂问题

在HotpotQA上F1值达80.8，超越BERT-large的78.1

信息检索

文档关联分析

利用链接信息增强文档相似度计算

🚀 LinkBERT-large

LinkBERT-large 是一个基于英文维基百科文章以及超链接信息进行预训练的模型。它在论文 LinkBERT: Pretraining Language Models with Document Links (ACL 2022) 中被提出。代码和数据可在此仓库中获取。

✨ 主要特性

融合文档链接信息：LinkBERT 是一种基于大型文档语料库进行预训练的 Transformer 编码器（类似 BERT）模型。它是对 BERT 的改进，能够捕捉超链接和引用链接等文档链接，从而融入跨多个文档的知识。具体而言，除了单个文档外，它还通过将链接的文档输入到同一个语言模型上下文中进行预训练。
广泛的适用性：可以直接替代 BERT 使用。在一般语言理解任务（如文本分类）中表现更优，尤其在知识密集型任务（如问答）和跨文档任务（如阅读理解、文档检索）中效果显著。

🚀 快速开始

该模型可通过在下游任务上进行微调使用，如下游任务包括问答、序列分类和标记分类等。你也可以使用原始模型进行特征提取（即为输入文本获取嵌入表示）。

💻 使用示例

基础用法

要在 PyTorch 中使用该模型获取给定文本的特征，可以使用以下代码：

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained('michiyasunaga/LinkBERT-large')
model = AutoModel.from_pretrained('michiyasunaga/LinkBERT-large')
inputs = tokenizer("Hello, my dog is cute", return_tensors="pt")
outputs = model(**inputs)
last_hidden_states = outputs.last_hidden_state

高级用法

对于微调，你可以使用此仓库或遵循其他任何 BERT 微调代码库。

📚 详细文档

模型描述

LinkBERT 是一种基于大型文档语料库进行预训练的 Transformer 编码器（类似 BERT）模型。它是对 BERT 的改进，能够捕捉超链接和引用链接等文档链接，从而融入跨多个文档的知识。具体而言，除了单个文档外，它还通过将链接的文档输入到同一个语言模型上下文中进行预训练。

LinkBERT 可以直接替代 BERT 使用。在一般语言理解任务（如文本分类）中表现更优，尤其在知识密集型任务（如问答）和跨文档任务（如阅读理解、文档检索）中效果显著。

预期用途与限制

该模型可通过在下游任务（如问答、序列分类和标记分类）上进行微调使用。你也可以使用原始模型进行特征提取（即为输入文本获取嵌入表示）。

评估结果

在下游任务上进行微调时，LinkBERT 取得了以下结果：

通用基准测试（MRQA 和 GLUE）：

	HotpotQA	TriviaQA	SearchQA	NaturalQ	NewsQA	SQuAD	GLUE
	F1	F1	F1	F1	F1	F1	平均得分
BERT-base	76.0	70.3	74.2	76.5	65.7	88.7	79.2
LinkBERT-base	78.2	73.9	76.8	78.3	69.3	90.1	79.6
BERT-large	78.1	73.7	78.3	79.0	70.9	91.1	80.7
LinkBERT-large	80.8	78.2	80.5	81.0	72.6	92.7	81.1

引用

如果你在项目中发现 LinkBERT 很有用，请引用以下内容：

@InProceedings{yasunaga2022linkbert,
  author =  {Michihiro Yasunaga and Jure Leskovec and Percy Liang},
  title =   {LinkBERT: Pretraining Language Models with Document Links},
  year =    {2022},  
  booktitle = {Association for Computational Linguistics (ACL)},  
}