xlmroberta-squadv2开源问答模型 - 免费部署精准解答各类问题

首页

Xlmroberta Squadv2

由 aware-ai 开发

这是针对问答任务在SQuADv2数据集上微调的xlm-roberta-large模型

问答系统

Transformers

#多语言问答 #长文本理解 #SQuADv2微调

下载量 15

发布时间 : 3/2/2022

模型简介

该模型是基于XLM-Roberta架构，在SQuADv2数据集上进行微调，专门用于问答任务的多语言模型。

模型特点

多语言支持

基于XLM-Roberta架构，具备强大的跨语言理解能力

问答任务优化

专门针对SQuADv2问答数据集进行微调

长文本处理

支持最大512长度的序列处理

模型能力

文本理解

问答系统

跨语言处理

使用案例

智能问答

事实性问答

基于给定文本回答具体问题

示例中正确回答了关于吉姆·汉森的问题

教育应用

阅读理解辅助

帮助学生理解文章内容并回答问题

🚀 XLM-ROBERTA-LARGE在SQuADv2上微调

本项目是在SQuADv2数据集上针对问答任务微调的xlm-roberta-large模型，可有效解决问答相关问题，为问答系统的构建提供强大的模型支持。

🚀 快速开始

以下是使用该模型进行问答的示例代码：

from transformers import XLMRobertaTokenizer, XLMRobertaForQuestionAnswering
import torch

tokenizer = XLMRobertaTokenizer.from_pretrained('a-ware/xlmroberta-squadv2')
model = XLMRobertaForQuestionAnswering.from_pretrained('a-ware/xlmroberta-squadv2')

question, text = "Who was Jim Henson?", "Jim Henson was a nice puppet"
encoding = tokenizer(question, text, return_tensors='pt')
input_ids = encoding['input_ids']
attention_mask = encoding['attention_mask']

start_scores, end_scores = model(input_ids, attention_mask=attention_mask, output_attentions=False)[:2]

all_tokens = tokenizer.convert_ids_to_tokens(input_ids[0])
answer = ' '.join(all_tokens[torch.argmax(start_scores) : torch.argmax(end_scores)+1])
answer = tokenizer.convert_tokens_to_ids(answer.split())
answer = tokenizer.decode(answer)
#answer => 'a nice puppet'

✨ 主要特性

本模型基于XLM-Roberta架构，在SQuADv2数据集上进行微调，可用于问答任务。

📚 详细文档

模型详情

XLM-Roberta在论文 XLM-R: State-of-the-art cross-lingual understanding through self-supervision 中被提出。

模型训练

该模型使用simpletransformers包装器，以下列参数进行训练：

train_args = {
    'learning_rate': 1e-5,
    'max_seq_length': 512,
    'doc_stride': 512,
    'overwrite_output_dir': True,
    'reprocess_input_data': False,
    'train_batch_size': 8,
    'num_train_epochs': 2,
    'gradient_accumulation_steps': 2,
    'no_cache': True,
    'use_cached_eval_features': False,
    'save_model_every_epoch': False,
    'output_dir': "bart-squadv2",
    'eval_batch_size': 32,
    'fp16_opt_level': 'O2',
    }