D

Deepcoder 14B Preview GGUF

Mungertによって開発
IQ-DynamicGate技術を採用した超低位量子化(1-2ビット)モデルで、メモリ制約のあるデバイスやエッジコンピューティングシナリオに適しています
ダウンロード数 1,764
リリース時間 : 4/11/2025

モデル概要

DeepSeek-R1蒸留版Qwen-14Bをベースにしたテキスト生成モデルで、革新的なIQ-DynamicGate量子化技術を採用し、極限のメモリ効率を維持しながら精度を最適化しています

モデル特徴

IQ-DynamicGate量子化技術
階層別特定戦略の精度適応量子化を採用し、1-2ビットの超低位量子化下でも高い精度を維持します
キーコンポーネント保護
埋め込み層と出力層にQ5_Kを使用して精度を保持し、38%の誤差伝播を低減します
混合量子化戦略
上位25%と下位25%の層にIQ4_XS、中間50%の層にIQ2_XXS/IQ3_Sを使用し、効率と精度のバランスを実現します

モデル能力

テキスト生成
低メモリ推論
エッジデバイス展開
量子化研究

使用事例

メモリ制約展開
低VRAM GPU推論
VRAMが限られたGPU上で大規模言語モデルを実行
IQ1_M量子化バージョンで43.9%のパープレキシティ低減
エッジデバイスAI
リソース制約のあるエッジデバイスに言語モデルを展開
IQ3_XSバージョンは極めて低いメモリしか必要としません
研究応用
超低位量子化研究
1-2ビット量子化の限界性能を研究
IQ1_Sは1ビットで39.7%優れた精度を維持
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase