I

Ibert Roberta Base

Developed by kssteven
I-BERT是RoBERTa的純整數量化版本,採用INT8格式存儲參數並使用整數運算進行推理,顯著提升推理速度。
Downloads 2,988
Release Time : 3/2/2022

Model Overview

I-BERT將Transformer架構中的浮點運算替換為整數運算,實現高效推理。適用於需要快速文本處理的任務。

Model Features

純整數運算
所有參數以INT8格式存儲,完全使用整數運算進行推理,無需浮點運算。
高效推理
在Nvidia T4 GPU上測試時,相比浮點版本可實現最高4倍的推理加速。
量化感知訓練
支持量化感知微調,通過三階段流程優化量化模型性能。

Model Capabilities

文本分類
自然語言理解
高效推理

Use Cases

文本處理
文本分類
如MRPC等文本分類任務
通過量化感知訓練保持較高準確率
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase