MobileBERT开源问答系统 - 免费部署实现高效精准问答功能

首页

Mobilebert Uncased Squad V2

由 csarron 开发

MobileBERT是BERT_LARGE的轻量化版本，在SQuAD2.0数据集上微调而成的问答系统模型。

问答系统

Transformers

英语开源协议:MIT #轻量级问答 #移动端优化 #多语言支持

下载量 29.11k

发布时间 : 3/2/2022

模型简介

本模型基于HuggingFace的google/mobilebert-uncased检查点，在SQuAD2.0数据集上微调而成，适用于问答系统任务。

模型特点

轻量化设计

MobileBERT是BERT_LARGE的轻量化版本，采用瓶颈结构设计，平衡了自注意力机制与前馈网络的关系。

高性能

在SQuAD2.0数据集上表现优异，EM分数达到75.2，F1分数达到78.8。

快速训练

在双GPU环境下，总训练时间仅需约3.5小时。

模型能力

问答系统

文本理解

信息提取

使用案例

教育

阅读理解辅助

帮助学生快速理解文章内容并回答问题。

信息检索

文档问答

从大量文档中快速提取相关信息并回答问题。

🚀 MobileBERT在SQuAD v2上微调

本项目基于MobileBERT在SQuAD v2数据集上进行微调，用于问答任务。MobileBERT是BERT_LARGE的精简版本，配备了瓶颈结构，并在自注意力机制和前馈网络之间进行了精心设计的平衡。

🚀 快速开始

示例代码

from transformers import pipeline

qa_pipeline = pipeline(
    "question-answering",
    model="csarron/mobilebert-uncased-squad-v2",
    tokenizer="csarron/mobilebert-uncased-squad-v2"
)

predictions = qa_pipeline({
    'context': "The game was played on February 7, 2016 at Levi's Stadium in the San Francisco Bay Area at Santa Clara, California.",
    'question': "What day was the game played on?"
})

print(predictions)
# 输出:
# {'score': 0.71434086561203, 'start': 23, 'end': 39, 'answer': 'February 7, 2016'}

✨ 主要特性

模型精简：MobileBERT是BERT_LARGE的精简版本，在保持性能的同时减少了模型大小。
微调优化：在SQuAD v2数据集上进行微调，适用于问答任务。

📦 安装指南

环境要求

Python: 3.7.5
机器配置：
- CPU: Intel(R) Core(TM) i7-6800K CPU @ 3.40GHz
- 内存: 32 GiB
- GPU: 2 GeForce GTX 1070，每块显存8GiB
- GPU驱动: 418.87.01，CUDA: 10.1

安装步骤

# 安装https://github.com/huggingface/transformers
cd examples/question-answering
mkdir -p data

wget -O data/train-v2.0.json https://rajpurkar.github.io/SQuAD-explorer/dataset/train-v2.0.json

wget -O data/dev-v2.0.json  https://rajpurkar.github.io/SQuAD-explorer/dataset/dev-v2.0.json

export SQUAD_DIR=`pwd`/data

python run_squad.py \
  --model_type mobilebert \
  --model_name_or_path google/mobilebert-uncased \
  --do_train \
  --do_eval \
  --do_lower_case \
  --version_2_with_negative \
  --train_file $SQUAD_DIR/train-v2.0.json \
  --predict_file $SQUAD_DIR/dev-v2.0.json \
  --per_gpu_train_batch_size 16 \
  --per_gpu_eval_batch_size 16 \
  --learning_rate 4e-5 \
  --num_train_epochs 5.0 \
  --max_seq_length 320 \
  --doc_stride 128 \
  --warmup_steps 1400 \
  --save_steps 2000 \
  --output_dir $SQUAD_DIR/mobilebert-uncased-warmup-squad_v2 2>&1 | tee train-mobilebert-warmup-squad_v2.log

微调大约需要3.5小时完成。