Q

Qwen2.5 3B Instruct GGUF

Mungertによって開発
IQ-DynamicGate技術を採用した超低ビット量子化(1-2ビット)モデルで、メモリ制約のあるデバイスや効率的な推論シナリオに適しています
ダウンロード数 704
リリース時間 : 4/25/2025

モデル概要

Qwen2.5-3B-InstructはQwen2.5-3Bを基にした命令最適化バージョンで、テキスト生成とチャットタスクをサポートします。革新的なIQ-DynamicGate量子化技術により、高精度を維持しながらメモリ使用量を大幅に削減します。

モデル特徴

IQ-DynamicGate量子化技術
階層化戦略による動的精度割り当てを採用し、超低ビット量子化(1-2ビット)でも高い精度を維持
重要コンポーネント保護
埋め込み層と出力層にはより高精度な量子化(Q5_K)を使用し、誤差伝播を低減
マルチフォーマット対応
BF16からIQ3_XSまで様々な量子化フォーマットを提供し、異なるハードウェア要件に対応
メモリ効率
最小量子化バージョンはわずか2.1GBのメモリで動作し、エッジデバイス展開に適しています

モデル能力

テキスト生成
対話システム
命令追従

使用事例

リソース制約環境展開
エッジデバイスAIアシスタント
メモリが限られたエッジデバイスにチャットボットを展開
IQ1_S量子化バージョンはわずか2.1GBのメモリで動作
CPU推論最適化
GPUがないデバイスで大規模言語モデルを実行
Q4_K量子化バージョンはCPU推論に適しています
研究応用
超低ビット量子化研究
1-2ビット量子化がモデル性能に与える影響を研究
IQ-DynamicGate技術は39.7%のパープレキシティ低減を実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase