MobileBERT開源問答系統 - 免費部署實現高效精準問答功能

首頁

Mobilebert Uncased Squad V2

由csarron開發

MobileBERT是BERT_LARGE的輕量化版本，在SQuAD2.0數據集上微調而成的問答系統模型。

問答系統

Transformers

英語開源協議:MIT #輕量級問答 #移動端優化 #多語言支持

下載量 29.11k

發布時間 : 3/2/2022

模型概述

本模型基於HuggingFace的google/mobilebert-uncased檢查點，在SQuAD2.0數據集上微調而成，適用於問答系統任務。

模型特點

輕量化設計

MobileBERT是BERT_LARGE的輕量化版本，採用瓶頸結構設計，平衡了自注意力機制與前饋網絡的關係。

高性能

在SQuAD2.0數據集上表現優異，EM分數達到75.2，F1分數達到78.8。

快速訓練

在雙GPU環境下，總訓練時間僅需約3.5小時。

模型能力

問答系統

文本理解

信息提取

使用案例

教育

閱讀理解輔助

幫助學生快速理解文章內容並回答問題。

信息檢索

文檔問答

從大量文檔中快速提取相關信息並回答問題。

🚀 MobileBERT在SQuAD v2上微調

本項目基於MobileBERT在SQuAD v2數據集上進行微調，用於問答任務。MobileBERT是BERT_LARGE的精簡版本，配備了瓶頸結構，並在自注意力機制和前饋網絡之間進行了精心設計的平衡。

🚀 快速開始

示例代碼

from transformers import pipeline

qa_pipeline = pipeline(
    "question-answering",
    model="csarron/mobilebert-uncased-squad-v2",
    tokenizer="csarron/mobilebert-uncased-squad-v2"
)

predictions = qa_pipeline({
    'context': "The game was played on February 7, 2016 at Levi's Stadium in the San Francisco Bay Area at Santa Clara, California.",
    'question': "What day was the game played on?"
})

print(predictions)
# 輸出:
# {'score': 0.71434086561203, 'start': 23, 'end': 39, 'answer': 'February 7, 2016'}

✨ 主要特性

模型精簡：MobileBERT是BERT_LARGE的精簡版本，在保持性能的同時減少了模型大小。
微調優化：在SQuAD v2數據集上進行微調，適用於問答任務。

📦 安裝指南

環境要求

Python: 3.7.5
機器配置：
- CPU: Intel(R) Core(TM) i7-6800K CPU @ 3.40GHz
- 內存: 32 GiB
- GPU: 2 GeForce GTX 1070，每塊顯存8GiB
- GPU驅動: 418.87.01，CUDA: 10.1

安裝步驟

# 安裝https://github.com/huggingface/transformers
cd examples/question-answering
mkdir -p data

wget -O data/train-v2.0.json https://rajpurkar.github.io/SQuAD-explorer/dataset/train-v2.0.json

wget -O data/dev-v2.0.json  https://rajpurkar.github.io/SQuAD-explorer/dataset/dev-v2.0.json

export SQUAD_DIR=`pwd`/data

python run_squad.py \
  --model_type mobilebert \
  --model_name_or_path google/mobilebert-uncased \
  --do_train \
  --do_eval \
  --do_lower_case \
  --version_2_with_negative \
  --train_file $SQUAD_DIR/train-v2.0.json \
  --predict_file $SQUAD_DIR/dev-v2.0.json \
  --per_gpu_train_batch_size 16 \
  --per_gpu_eval_batch_size 16 \
  --learning_rate 4e-5 \
  --num_train_epochs 5.0 \
  --max_seq_length 320 \
  --doc_stride 128 \
  --warmup_steps 1400 \
  --save_steps 2000 \
  --output_dir $SQUAD_DIR/mobilebert-uncased-warmup-squad_v2 2>&1 | tee train-mobilebert-warmup-squad_v2.log

微調大約需要3.5小時完成。