bert-base-uncased-squadv1-x2.32開源問答模型，推理加速，免費暢用高效問答

首頁

Bert Base Uncased Squadv1 X2.32 F86.6 D15 Hybrid V1

由madlag開發

基於BERT-base uncased模型在SQuAD v1上微調的問答模型，通過nn_pruning庫修剪了66%的線性層權重，推理速度提升2.32倍

問答系統

Transformers

英語開源協議:MIT #問答加速 #結構化修剪 #低資源推理

下載量 16

發布時間 : 3/2/2022

模型概述

這是一個經過修剪優化的問答模型，專門用於從給定文本中提取答案。模型通過結構化修剪技術平衡了速度與準確率

模型特點

高效推理

通過結構化修剪技術實現2.32倍加速，同時保持86.6%的F1分數

注意力頭優化

移除了43.8%的注意力頭(144→81)，優化計算效率

知識蒸餾

從bert-large-uncased模型蒸餾而來，提升小模型性能

模型能力

文本理解

問答提取

上下文分析

使用案例

智能客服

自動問答系統

從知識庫文檔中自動回答用戶問題

F1分數86.64

教育技術

學習輔助工具

幫助學生從教材中快速找到問題答案

🚀 BERT-base無大小寫區分模型在SQuAD v1上微調

本模型解決了在問答任務中提升模型推理速度同時儘量保持準確率的問題。通過對BERT-base無大小寫區分模型進行微調與剪枝，在SQuAD v1數據集上實現了推理速度的提升，為問答系統的實際應用提供了更高效的解決方案。

🚀 快速開始

要使用此模型，首先需要安裝nn_pruning庫，它包含優化腳本，可通過移除空行/列將線性層打包成更小的形式。

pip install nn_pruning

然後，你可以像往常一樣使用transformers庫，只需在管道加載時調用optimize_model即可。

from transformers import pipeline
from nn_pruning.inference_model_patcher import optimize_model

qa_pipeline = pipeline(
    "question-answering",
    model="madlag/bert-base-uncased-squadv1-x2.32-f86.6-d15-hybrid-v1",
    tokenizer="madlag/bert-base-uncased-squadv1-x2.32-f86.6-d15-hybrid-v1"
)

print("bert-base-uncased參數數量: 165.0M")
print(f"參數數量（僅包括注意力頭剪枝，不包括前饋層剪枝）={int(qa_pipeline.model.num_parameters() / 1E6)}M")
qa_pipeline.model = optimize_model(qa_pipeline.model, "dense")

print(f"完全優化後的參數數量={int(qa_pipeline.model.num_parameters() / 1E6)}M")
predictions = qa_pipeline({
    'context': "Frédéric François Chopin, born Fryderyk Franciszek Chopin (1 March 1810 – 17 October 1849), was a Polish composer and virtuoso pianist of the Romantic era who wrote primarily for solo piano.",
    'question': "Who is Frederic Chopin?",
})
print("預測結果", predictions)

✨ 主要特性

剪枝優化：線性層僅包含原權重的15.0%，整體模型包含原權重的34.0%，通過剪枝方法得到結構化矩陣，使模型在評估時運行速度比bert-base-uncased快2.32倍。
準確率表現：在準確率方面，其F1值為86.64，相比bert-base-uncased的88.5，F1值下降了1.86。
大小寫不敏感：該模型不區分大小寫，例如不區分english和English。

📚 詳細文檔

精細剪枝細節

本模型是基於HuggingFace的bert-base-uncased檢查點在SQuAD1.1上進行微調，並從bert-large-uncased-whole-word-masking-finetuned-squad模型進行知識蒸餾得到的。塊剪枝的一個副作用是部分注意力頭被完全移除，在總共144個注意力頭中移除了63個（43.8%）。

SQuAD1.1數據集詳情

數據集	劃分	樣本數量
SQuAD1.1	訓練集	90.6K
SQuAD1.1	評估集	11.1k

微調信息

Python版本：3.8.5
機器規格：

CPU: Intel(R) Core(TM) i7-6700K CPU
內存: 64 GiB
GPU: 1 GeForce GTX 3090，顯存24GiB
GPU驅動: 455.23.05，CUDA: 11.1

結果

Pytorch模型文件大小：368MB（原始BERT：420MB）

指標	值	原始值（表2）	變化
精確匹配率（EM）	78.77	80.8	-2.03
F1值	86.64	88.5	-1.86

📄 許可證

本模型採用MIT許可證。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫