mobilebert-uncased-finetuned-squadv2开源问答模型 - 处理可答与不可答问题超实用

首页

Mobilebert Uncased Finetuned Squadv2

由 mrm8488 开发

基于MobileBERT轻量级架构微调的问答模型，专门针对SQuAD v2数据集优化，可处理可回答与不可回答问题。

问答系统

Transformers

英语#轻量问答 #不可答检测 #低资源微调

下载量 68

发布时间 : 3/2/2022

模型简介

该模型是MobileBERT在SQuAD v2数据集上的微调版本，用于问答任务，能够判断段落中是否存在答案并给出相应回答。

模型特点

轻量高效

相比标准BERT模型，MobileBERT体积更小、计算效率更高，适合移动端部署。

不可回答问题检测

专门针对SQuAD v2数据集优化，可识别段落中无支持答案的情况。

快速收敛

微调训练过程收敛速度快，显著降低计算成本。

模型能力

阅读理解

问答系统

文本理解

不可回答问题检测

使用案例

教育技术

自动答题系统

帮助学生根据教材内容自动获取问题答案

准确率约75%的EM分数

客户服务

FAQ自动应答

根据知识库内容回答客户常见问题

能识别知识库中未包含的问题

🚀 MobileBERT + SQuAD v2 📱❓

mobilebert-uncased 在 SQUAD v2.0 数据集上进行微调，用于问答（Q&A）下游任务。

🚀 快速开始

本项目是将 mobilebert-uncased 在 SQUAD v2.0 数据集上进行微调，以完成问答（Q&A）下游任务。

✨ 主要特性

模型精简：MobileBERT 是 BERT_LARGE 的精简版本，配备了瓶颈结构，并且在自注意力机制和前馈网络之间进行了精心设计的平衡。
收敛快速：该模型比其他模型收敛速度快很多，微调成本较低。

📦 安装指南

模型在 Tesla P100 GPU 和 25GB 内存上进行训练，使用以下命令：

python transformers/examples/question-answering/run_squad.py \
  --model_type bert \
  --model_name_or_path 'google/mobilebert-uncased' \
  --do_eval \
  --do_train \
  --do_lower_case \
  --train_file '/content/dataset/train-v2.0.json' \
  --predict_file '/content/dataset/dev-v2.0.json' \
  --per_gpu_train_batch_size 16 \
  --learning_rate 3e-5 \
  --num_train_epochs 5 \
  --max_seq_length 384 \
  --doc_stride 128 \
  --output_dir '/content/output' \
  --overwrite_output_dir \
  --save_steps 1000 \
  --version_2_with_negative

💻 使用示例

基础用法

使用 pipelines 快速调用模型：

from transformers import pipeline
QnA_pipeline = pipeline('question-answering', model='mrm8488/mobilebert-uncased-finetuned-squadv2')
QnA_pipeline({
    'context': 'A new strain of flu that has the potential to become a pandemic has been identified in China by scientists.',
    'question': 'Who did identified it ?'
    })
    
# Output: {'answer': 'scientists.', 'end': 106, 'score': 0.41531604528427124, 'start': 96}

📚 详细文档

下游任务（问答）- 模型 🧠

MobileBERT 是 BERT_LARGE 的精简版本，配备了瓶颈结构，并且在自注意力机制和前馈网络之间进行了精心设计的平衡。

此处使用的检查点是原始的 MobileBert 优化无大小写英文检查点：(uncased_L-24_H-128_B-512_A-4_F-4_OPT)。

更多关于该模型的信息请参考这里。

下游任务（问答）- 数据集 📚

SQuAD2.0 将 SQuAD1.1 中的 100,000 个问题与超过 50,000 个由众包工作者对抗性编写的无法回答的问题相结合，这些无法回答的问题在外观上与可回答的问题相似。要在 SQuAD2.0 上取得好成绩，系统不仅要在可能的情况下回答问题，还要确定段落何时不支持任何答案并放弃回答。