D

Distilbert Base Uncased Distilled Squad Int8 Static Inc

由Intel開發
這是DistilBERT基礎未編碼模型的INT8量化版本,專為問答任務設計,通過訓練後靜態量化優化了模型大小和推理速度。
下載量 1,737
發布時間 : 8/4/2022

模型概述

該模型是DistilBERT基礎未編碼模型的INT8量化版本,已在斯坦福問答數據集(SQuAD)上進行了微調。量化過程使用了Hugging Face的Optimum-Intel工具和英特爾®神經壓縮器技術,旨在保持較高準確性的同時顯著降低模型大小和推理延遲。

模型特點

INT8量化
通過訓練後靜態量化將模型從FP32精度轉換為INT8,顯著減少模型大小和推理延遲。
高效推理
優化後的模型適合在計算資源受限的環境中部署,提供低延遲的問答能力。
高準確性保留
在量化過程中儘可能保留原始模型的準確性,確保問答任務的高效執行。

模型能力

問答任務
文本理解
上下文分析

使用案例

問答系統
基於上下文的問答
在給定上下文段落的情況下回答問題,適用於知識庫查詢、客服系統等場景。
F1分數:86.1069(INT8 PyTorch版本)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase