D

Dynamic Minilmv2 L6 H384 Squad1.1 Int8 Static

由Intel開發
QuaLA-MiniLM是英特爾開發的微型語言模型,融合知識蒸餾、長度自適應變換器和8位量化技術,在SQuAD1.1數據集上實現最高8.8倍加速且精度損失不足1%。
下載量 172
發布時間 : 11/21/2022

模型概述

該模型通過動態調整計算資源分配實現高效推理,適用於需要平衡精度與效率的自然語言處理任務。

模型特點

動態計算分配
通過LAT技術實現各層token數的動態調整,適應不同計算預算
高效量化
採用8位量化技術減少模型體積,量化後體積僅為原模型的30%
知識蒸餾
從RoBERTa-Large教師模型蒸餾知識,保持小模型的高精度

模型能力

文本理解
問答系統
高效推理

使用案例

智能問答
維基百科內容問答
基於SQuAD1.1數據集的問答應用
在保持87.68% F1精度下實現8.8倍加速
邊緣計算
移動端問答系統
在資源受限設備上部署高效語言模型
量化後模型體積僅84.86MB
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase