B

BAGEL 7B MoT DF11

由DFloat11開發
採用DFloat11無損壓縮技術的BAGEL-7B-MoT模型,體積縮小32%的同時保持比特級輸出一致
下載量 428
發布時間 : 5/25/2025

模型概述

基於BAGEL-7B-MoT模型,通過DFloat11壓縮技術實現模型體積縮減,適用於需要高效存儲和運行的場景

模型特點

DFloat11無損壓縮
採用動態長度浮點壓縮技術,模型體積縮小32%,同時保持100%精度
高效GPU運行
通過硬件感知算法設計實現GPU端即時權重解壓,保持高效推理速度
霍夫曼編碼優化
對BFloat16模型權重中的指數位應用霍夫曼編碼,實現高壓縮率

模型能力

文本生成
高效壓縮模型推理

使用案例

高效推理
大模型部署
在資源受限環境中部署大型語言模型
模型體積減少32%,內存佔用降低
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase