S

Svdq Int4 Flux.1 Dev

mit-han-labによって開発
SVDQuantは4ビット重みと活性化のポストトレーニング量子化技術で、視覚的忠実度を良好に保持します。120億パラメータのFLUX.1-devモデルでは、BF16モデルと比較して3.6倍のメモリ圧縮を実現しました。
ダウンロード数 60.72k
リリース時間 : 11/25/2024

モデル概要

FLUX.1-devモデルを基にしたINT4量子化バージョンで、SVDQuant技術を用いて効率的な4ビット重みと活性化量子化を実現し、推論速度を大幅に向上させメモリ使用量を削減します。

モデル特徴

効率的な4ビット量子化
SVDQuant技術により4ビット重みと活性化量子化を実現し、BF16モデルと比較して3.6倍のメモリ圧縮を達成
最適化された推論速度
16GB VRAMのノートブック4090 GPU上で16ビットモデルより8.7倍高速、NF4 W4A16ベースラインより3倍高速
高い視覚忠実度
PixArt-∑モデルにおいて、その視覚品質は他のW4A4やW4A8ベースラインを大幅に上回る
革新的な低ランク分解
SVDにより重みを低ランク成分と残差に分解し、低ランク分岐は16ビット精度で動作させることで量子化の難易度を緩和

モデル能力

テキスト生成画像
高解像度画像生成
高速推論

使用事例

クリエイティブデザイン
コンセプトアート生成
テキスト記述に基づき迅速にコンセプトアート画像を生成
高品質な視覚出力で、クリエイティブワークフローに適している
教育
教材生成
教育内容に応じて自動的に補助視覚教材を生成
教育ニーズに合致した画像を迅速に作成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase