cs224n-squad2.0-albert-base-v2開源模型 - 免費用於SQuAD2.0問答任務基準測試

首頁

Cs224n Squad2.0 Albert Base V2

由elgeish開發

為斯坦福CS224n課程學生提供的ALBERT-base-v2模型，用於SQuAD2.0問答任務基準測試

問答系統

Transformers

#問答系統 #教育輔助 #ALBERT微調

下載量 169

發布時間 : 3/2/2022

模型概述

該模型基於ALBERT-base-v2架構，在SQuAD2.0數據集上微調，旨在幫助學生快速建立問答系統基準模型

模型特點

課程專用優化

專為CS224n課程設計，節省學生建立基準模型所需GPU時間

數據子集評估

使用隨機選取的半數官方開發集樣本(6078例)進行評估和模型選擇

負樣本支持

支持處理無答案的負樣本情況，符合SQuAD2.0任務要求

模型能力

閱讀理解

問答系統

文本理解

無答案檢測

使用案例

教育

課程項目基準

作為CS224n課程學生期末項目的性能基準

提供78.94%的精確匹配率和81.77%的F1分數

研究

問答系統研究

用於問答系統相關研究的基線模型

🚀 CS224n SQuAD2.0項目數據集

本模型旨在為CS224n的學生在為默認最終項目建立待超越的基線時節省GPU時間。用於微調此模型的訓練集與官方訓練集相同；不過，評估和模型選擇是使用官方開發集的大約一半（隨機選取的6078個示例）進行的。數據文件可在https://github.com/elgeish/squad/tree/master/data找到 — 這是2020年冬季版本。鑑於官方SQuAD2.0開發集包含該項目的測試集，學生必須確保不以任何方式使用官方SQuAD2.0開發集 — 包括使用在官方SQuAD2.0上微調的模型，因為它們在模型選擇時使用了官方SQuAD2.0開發集。

✨ 主要特性

📊 結果

{
  "exact": 78.94044093451794,
  "f1": 81.7724930324639,
  "total": 6078,
  "HasAns_exact": 76.28865979381443,
  "HasAns_f1": 82.20385314478195,
  "HasAns_total": 2910,
  "NoAns_exact": 81.37626262626263,
  "NoAns_f1": 81.37626262626263,
  "NoAns_total": 3168,
  "best_exact": 78.95689371503784,
  "best_exact_thresh": 0.0,
  "best_f1": 81.78894581298378,
  "best_f1_thresh": 0.0
}

⚙️ 顯著參數

{
  "do_lower_case": true,
  "doc_stride": 128,
  "fp16": false,
  "fp16_opt_level": "O1",
  "gradient_accumulation_steps": 24,
  "learning_rate": 3e-05,
  "max_answer_length": 30,
  "max_grad_norm": 1,
  "max_query_length": 64,
  "max_seq_length": 384,
  "model_name_or_path": "albert-base-v2",
  "model_type": "albert",
  "num_train_epochs": 3,
  "per_gpu_train_batch_size": 8,
  "save_steps": 5000,
  "seed": 42,
  "train_batch_size": 8,
  "version_2_with_negative": true,
  "warmup_steps": 0,
  "weight_decay": 0
}

💻 環境設置

{
  "transformers": "2.5.1",
  "pytorch": "1.4.0=py3.6_cuda10.1.243_cudnn7.6.3_0",
  "python": "3.6.5=hc3d631a_2",
  "os": "Linux 4.15.0-1060-aws #62-Ubuntu SMP Tue Feb 11 21:23:22 UTC 2020 x86_64 x86_64 x86_64 GNU/Linux",
  "gpu": "Tesla V100-SXM2-16GB"
}

📚 詳細文檔

📝 引用方式

@misc{elgeish2020gestalt,
  title={Gestalt: a Stacking Ensemble for SQuAD2.0},
  author={Mohamed El-Geish},
  journal={arXiv e-prints},
  archivePrefix={arXiv},
  eprint={2004.07067},
  year={2020},
}