O

Omnigen2 Transformer DF11

由DFloat11開發
OmniGen2/OmniGen2的DFloat11無損壓縮版本,模型大小縮小32%,保持位級相同輸出,支持高效GPU推理。
下載量 593
發布時間 : 6/25/2025

模型概述

這是原始OmniGen2/OmniGen2模型的DFloat11無損壓縮版本,通過霍夫曼編碼對BFloat16模型權重的指數位進行壓縮,實現了模型大小的顯著減小,同時保持了原始模型的輸出精度和推理性能。

模型特點

無損壓縮
通過DFloat11壓縮技術,模型大小縮小32%,同時保持位級相同的輸出。
高效GPU推理
實現了高效的CUDA內核,支持在GPU上進行即時權重解壓縮,推理性能與原始模型相當。
霍夫曼編碼
對BFloat16模型權重的指數位進行無損壓縮,這些指數位具有很高的壓縮性。

模型能力

任意到任意生成
高效GPU推理
無損壓縮模型

使用案例

圖像生成
高分辨率圖像生成
支持1024×1024等高分辨率圖像的生成。
峰值GPU內存使用從18.41 GB降低到14.36 GB。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase