G

GLM Z1 32B 0414 GGUF

Mungertによって開発
GLM-Z1-32B-0414は32Bパラメータ規模の多言語テキスト生成モデルで、中国語と英語をサポートし、MITライセンスで公開されています。
ダウンロード数 994
リリース時間 : 4/25/2025

モデル概要

このモデルはllama.cppに基づいて生成され、テキスト生成タスクをサポートし、特に超低ビット量子化技術を最適化しており、メモリ制約のある展開シナリオに適しています。

モデル特徴

IQ-DynamicGate超低ビット量子化
精度適応量子化技術を採用し、1-2ビットモデルに適用可能で、メモリ効率を維持しながら精度を大幅に向上させます。
動的精度割り当て
上位25%と下位25%の層にIQ4_XSを使用し、中間50%にIQ2_XXS/IQ3_Sを使用し、重要なコンポーネント保護にQ5_Kを使用します。
高性能推論
BF16とF16フォーマットをサポートし、さまざまなハードウェアアクセラレーション要件に対応し、高速な推論能力を提供します。

モデル能力

テキスト生成
多言語サポート
超低ビット量子化推論

使用事例

メモリ制約展開
CPU推論
メモリが限られたCPUデバイスでモデルを実行し、エッジコンピューティングシナリオに適しています。
メモリ使用量を削減し、合理的な精度を維持します。
低VRAM GPU推論
VRAMが限られたGPUで量子化モデルを実行し、リソース制約環境に適応します。
VRAM要件を大幅に削減し、推論速度を向上させます。
研究と応用
超低ビット量子化研究
1-2ビット量子化技術の効果と最適化方法を研究するために使用されます。
さまざまな量子化バリエーションを提供し、比較分析を容易にします。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase