DistilBERT开源问答AI模型 - 免费部署，INT8量化优化问答速度与大小

首页

Distilbert Base Uncased Distilled Squad Int8 Static Inc

由 Intel 开发

这是DistilBERT基础未编码模型的INT8量化版本，专为问答任务设计，通过训练后静态量化优化了模型大小和推理速度。

问答系统

Transformers

开源协议:Apache-2.0 #问答系统优化 #INT8量化 #低资源部署

下载量 1,737

发布时间 : 8/4/2022

模型简介

该模型是DistilBERT基础未编码模型的INT8量化版本，已在斯坦福问答数据集（SQuAD）上进行了微调。量化过程使用了Hugging Face的Optimum-Intel工具和英特尔®神经压缩器技术，旨在保持较高准确性的同时显著降低模型大小和推理延迟。

模型特点

INT8量化

通过训练后静态量化将模型从FP32精度转换为INT8，显著减少模型大小和推理延迟。

高效推理

优化后的模型适合在计算资源受限的环境中部署，提供低延迟的问答能力。

高准确性保留

在量化过程中尽可能保留原始模型的准确性，确保问答任务的高效执行。

模型能力

问答任务

文本理解

上下文分析

使用案例

问答系统

基于上下文的问答

在给定上下文段落的情况下回答问题，适用于知识库查询、客服系统等场景。

F1分数：86.1069（INT8 PyTorch版本）

🚀 INT8 DistilBERT Base Uncased在SQuAD上微调模型卡

本模型是DistilBERT base uncased的INT8量化版本，该模型已在斯坦福问答数据集（SQuAD）上进行了微调。量化过程使用了Hugging Face的Optimum-Intel，并借助了英特尔®神经压缩器（Intel® Neural Compressor）。

✨ 主要特性

量化优势：通过训练后静态量化将模型从原始的FP32精度转换为INT8，在优化模型大小和推理速度的同时，尽可能保留原始模型的准确性。
适用场景：专为问答任务设计，适用于需要快速推理和减小模型大小，同时又不显著降低准确性的场景。
目标用户：适用于研究人员、开发者和企业，特别是在计算资源有限的应用中，需要高效、低延迟问答能力的用户。

📦 安装指南

此部分未提供具体安装步骤，暂不展示。

💻 使用示例

基础用法

# Optimum Intel w/ Neural Compressor
from optimum.intel import INCModelForQuestionAnswering

model_id = "Intel/distilbert-base-uncased-distilled-squad-int8-static"
int8_model = INCModelForQuestionAnswering.from_pretrained(model_id)

高级用法

# Optimum w/ ONNX Runtime
from optimum.onnxruntime import ORTModelForQuestionAnswering
model = ORTModelForQuestionAnswering.from_pretrained('Intel/distilbert-base-uncased-distilled-squad-int8-static')

📚 详细文档

模型详情

属性	详情
模型作者	Xin He、Zixuan Cheng、Yu Wenz
日期	2022年8月4日
版本	此量化过程的基础模型是distilbert-base-uncased-distilled-squad，它是为问答任务设计的BERT蒸馏版本。
模型类型	语言模型
论文或其他资源	基础模型：distilbert-base-uncased-distilled-squad
许可证	apache-2.0
问题或评论	社区板块和英特尔开发者中心Discord
量化详情	该模型经过训练后静态量化，从原始的FP32精度转换为INT8，旨在优化模型大小和推理速度，同时尽可能保留原始模型的准确性。
校准详情	对于PyTorch，校准数据加载器是训练数据加载器，实际采样大小为304，因为默认校准采样大小300不能被批量大小8整除。对于ONNX版本，使用评估数据加载器进行校准，默认校准采样大小为100。

预期用途

预期用途	描述
主要预期用途	该模型用于问答任务，可根据给定的上下文段落回答问题。它针对需要快速推理和减小模型大小，同时又不显著降低准确性的场景进行了优化。
主要目标用户	需要在应用程序中实现高效、低延迟问答功能的研究人员、开发者和企业，特别是在计算资源有限的情况下。
超出范围的用途	无