electra-small-finetuned-squadv2开源问答模型 - 区分可答与不可答问题超实用

首页

Electra Small Finetuned Squadv2

由 mrm8488 开发

基于Electra-small-discriminator模型在SQuAD v2.0数据集上微调的问答模型，适用于区分可回答与不可回答问题的场景

问答系统

Transformers

英语开源协议:Apache-2.0 #问答系统 #小模型高效 #对抗性训练

下载量 51

发布时间 : 3/2/2022

模型简介

该模型通过ELECTRA预训练方法优化，专门用于问答任务，能够判断段落是否支持答案并在无答案时保持克制

模型特点

对抗训练优势

采用ELECTRA的对抗训练方法，通过区分真实与生成标记进行预训练，计算效率高

不可回答问题处理

专门针对SQuAD v2.0中不可回答问题的场景优化，能准确判断何时应保持克制

轻量级模型

仅50MB大小的小型模型，适合资源受限环境部署

模型能力

文本理解

问题回答

答案可信度判断

使用案例

教育

智能学习助手

帮助学生快速从教材中找到问题答案

准确率69.71% (EM)

客服

自动问答系统

处理客户常见问题，识别无法回答的查询

F1得分73.44%

🚀 小型ELECTRA模型⚡ + SQuAD v2问答数据集❓

本项目基于小型ELECTRA判别器，在 SQuAD v2.0数据集上进行微调，以用于问答（Q&A）下游任务。该模型能够有效处理问答任务，在问答准确性和效率上有不错的表现。

🚀 快速开始

你可以使用以下代码快速调用该模型进行问答任务：

from transformers import pipeline
QnA_pipeline = pipeline('question-answering', model='mrm8488/electra-base-finetuned-squadv2')
QnA_pipeline({
    'context': 'A new strain of flu that has the potential to become a pandemic has been identified in China by scientists.',
    'question': 'What has been discovered by scientists from China ?'
})
# 输出:
{'answer': 'A new strain of flu', 'end': 19, 'score': 0.8650811568752914, 'start': 0}

✨ 主要特性

高效预训练：ELECTRA是一种用于自监督语言表征学习的新方法，能以相对较少的计算资源预训练Transformer网络。
处理复杂问答：SQuAD2.0数据集包含大量可回答和不可回答的问题，模型需要判断何时无法从段落中找到答案并放弃回答。

📦 安装指南

模型在Tesla P100 GPU和25GB内存的环境下，使用以下命令进行训练：

python transformers/examples/question-answering/run_squad.py \
  --model_type electra \
  --model_name_or_path 'google/electra-small-discriminator' \
  --do_eval \
  --do_train \
  --do_lower_case \
  --train_file '/content/dataset/train-v2.0.json' \
  --predict_file '/content/dataset/dev-v2.0.json' \
  --per_gpu_train_batch_size 16 \
  --learning_rate 3e-5 \
  --num_train_epochs 10 \
  --max_seq_length 384 \
  --doc_stride 128 \
  --output_dir '/content/output' \
  --overwrite_output_dir \
  --save_steps 1000 \
  --version_2_with_negative

📚 详细文档

下游任务详情 - 模型 🧠

ELECTRA 是一种用于自监督语言表征学习的新方法，它可以用相对较少的计算资源来预训练Transformer网络。ELECTRA模型通过训练来区分“真实”输入标记和由另一个神经网络生成的“虚假”输入标记，类似于生成对抗网络（GAN）中的判别器。在小规模情况下，即使在单个GPU上进行训练，ELECTRA也能取得不错的效果。在大规模情况下，ELECTRA在 SQuAD 2.0 数据集上取得了最先进的结果。

下游任务详情 - 数据集 📚

SQuAD2.0 将SQuAD1.1中的100,000个问题与超过50,000个由众包工作者对抗性编写的无法回答的问题相结合，这些问题看起来与可回答的问题相似。要在SQuAD2.0上表现良好，系统不仅要在可能的情况下回答问题，还要判断段落中何时不支持答案并放弃回答。

📦 测试集结果 🧾

指标	值
精确匹配率（EM）	69.71
F1分数	73.44
模型大小	50 MB

以下是详细的JSON格式测试结果：

{
'exact': 69.71279373368147,
'f1': 73.4439546123672,
'total': 11873,
'HasAns_exact': 69.92240215924427,
'HasAns_f1': 77.39542393937836,
'HasAns_total': 5928,
'NoAns_exact': 69.50378469301934,
'NoAns_f1': 69.50378469301934,
'NoAns_total': 5945,
'best_exact': 69.71279373368147,
'best_exact_thresh': 0.0,
'best_f1': 73.44395461236732,
'best_f1_thresh': 0.0
}