I

Ibert Roberta Large

由kssteven開發
I-BERT是RoBERTa-large的純整數量化版本,通過INT8存儲參數並使用整數運算執行推理,最高可實現4倍推理加速。
下載量 45
發布時間 : 3/2/2022

模型概述

基於RoBERTa架構的整數量化模型,專為高效推理設計,適用於需要快速文本處理的任務。

模型特點

純整數運算
所有參數以INT8格式存儲,完全使用整數運算執行推理,無需浮點計算單元
量化感知訓練
支持三階段微調流程(全精度→量化→整數微調),最大限度保持量化後精度
4倍推理加速
在Nvidia T4 GPU上相比浮點版本實現最高4倍的推理速度提升

模型能力

文本分類
語義理解
高效推理

使用案例

文本處理
語義相似度判斷
如MRPC任務中的句子對相似性分類
在量化後保持接近全精度模型的準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase