G

Granite 3.2 8b Instruct GGUF

Mungertによって開発
IBM Graniteシリーズ8Bパラメータ命令微調整言語モデル、IQ-DynamicGate超低ビット量子化技術を採用し、効率的な推論シーンに適応
ダウンロード数 1,048
リリース時間 : 3/19/2025

モデル概要

このモデルはIBM Graniteシリーズの中規模言語モデルで、命令微調整最適化を経ており、テキスト生成タスクをサポートします。革新的なIQ-DynamicGate量子化技術を採用し、1-2ビット精度で高い性能を維持できます。

モデル特徴

IQ-DynamicGate量子化技術
革新的な1-2ビット精度適応量子化方法、階層化戦略によりメモリ効率を維持しながらモデル精度を保持
混合精度割り当て
上位25%と下位25%の層にIQ4_XS、中間50%の層にIQ2_XXS/IQ3_Sを使用、重要なコンポーネントにはQ5_Kで保護
効率的な推論
CPUと低VRAMデバイス向けに最適化、様々なハードウェア環境に適応する複数量化バージョンを提供

モデル能力

テキスト生成
命令追従
低リソース推論

使用事例

エッジコンピューティング
モバイルデバイスAIアシスタント
メモリ制約のあるモバイルデバイスにインテリジェントアシスタントを展開
IQ1_M量子化バージョンで困惑度43.9%低減
研究開発
超低ビット量子化研究
1-2ビット量子化技術の研究プラットフォームとして
IQ2_S量子化バージョンは0.2GB増加のみで困惑度36.9%低減
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase