DistilBERT開源問答AI模型 - 免費部署，INT8量化優化問答速度與大小

首頁

Distilbert Base Uncased Distilled Squad Int8 Static Inc

由Intel開發

這是DistilBERT基礎未編碼模型的INT8量化版本，專為問答任務設計，通過訓練後靜態量化優化了模型大小和推理速度。

問答系統

Transformers

開源協議:Apache-2.0 #問答系統優化 #INT8量化 #低資源部署

下載量 1,737

發布時間 : 8/4/2022

模型概述

該模型是DistilBERT基礎未編碼模型的INT8量化版本，已在斯坦福問答數據集（SQuAD）上進行了微調。量化過程使用了Hugging Face的Optimum-Intel工具和英特爾®神經壓縮器技術，旨在保持較高準確性的同時顯著降低模型大小和推理延遲。

模型特點

INT8量化

通過訓練後靜態量化將模型從FP32精度轉換為INT8，顯著減少模型大小和推理延遲。

高效推理

優化後的模型適合在計算資源受限的環境中部署，提供低延遲的問答能力。

高準確性保留

在量化過程中儘可能保留原始模型的準確性，確保問答任務的高效執行。

模型能力

問答任務

文本理解

上下文分析

使用案例

問答系統

基於上下文的問答

在給定上下文段落的情況下回答問題，適用於知識庫查詢、客服系統等場景。

F1分數：86.1069（INT8 PyTorch版本）

🚀 INT8 DistilBERT Base Uncased在SQuAD上微調模型卡

本模型是DistilBERT base uncased的INT8量化版本，該模型已在斯坦福問答數據集（SQuAD）上進行了微調。量化過程使用了Hugging Face的Optimum-Intel，並藉助了英特爾®神經壓縮器（Intel® Neural Compressor）。

✨ 主要特性

量化優勢：通過訓練後靜態量化將模型從原始的FP32精度轉換為INT8，在優化模型大小和推理速度的同時，儘可能保留原始模型的準確性。
適用場景：專為問答任務設計，適用於需要快速推理和減小模型大小，同時又不顯著降低準確性的場景。
目標用戶：適用於研究人員、開發者和企業，特別是在計算資源有限的應用中，需要高效、低延遲問答能力的用戶。

📦 安裝指南

此部分未提供具體安裝步驟，暫不展示。

💻 使用示例

基礎用法

# Optimum Intel w/ Neural Compressor
from optimum.intel import INCModelForQuestionAnswering

model_id = "Intel/distilbert-base-uncased-distilled-squad-int8-static"
int8_model = INCModelForQuestionAnswering.from_pretrained(model_id)

高級用法

# Optimum w/ ONNX Runtime
from optimum.onnxruntime import ORTModelForQuestionAnswering
model = ORTModelForQuestionAnswering.from_pretrained('Intel/distilbert-base-uncased-distilled-squad-int8-static')

📚 詳細文檔

模型詳情

屬性	詳情
模型作者	Xin He、Zixuan Cheng、Yu Wenz
日期	2022年8月4日
版本	此量化過程的基礎模型是distilbert-base-uncased-distilled-squad，它是為問答任務設計的BERT蒸餾版本。
模型類型	語言模型
論文或其他資源	基礎模型：distilbert-base-uncased-distilled-squad
許可證	apache-2.0
問題或評論	社區板塊和英特爾開發者中心Discord
量化詳情	該模型經過訓練後靜態量化，從原始的FP32精度轉換為INT8，旨在優化模型大小和推理速度，同時儘可能保留原始模型的準確性。
校準詳情	對於PyTorch，校準數據加載器是訓練數據加載器，實際採樣大小為304，因為默認校準採樣大小300不能被批量大小8整除。對於ONNX版本，使用評估數據加載器進行校準，默認校準採樣大小為100。

預期用途

預期用途	描述
主要預期用途	該模型用於問答任務，可根據給定的上下文段落回答問題。它針對需要快速推理和減小模型大小，同時又不顯著降低準確性的場景進行了優化。
主要目標用戶	需要在應用程序中實現高效、低延遲問答功能的研究人員、開發者和企業，特別是在計算資源有限的情況下。
超出範圍的用途	無