O

Olympiccoder 32B GGUF

Mungertによって開発
OlympicCoder-32BはQwen2.5-Coder-32B-Instructをベースとしたコード生成モデルで、IQ-DynamicGate超低位量子化技術を採用し、メモリ制約環境下での効率的な推論に適しています。
ダウンロード数 361
リリース時間 : 3/31/2025

モデル概要

このモデルはコード生成タスクに特化しており、革新的な1-2ビット量子化手法を採用することで、高精度を維持しながらメモリ使用量を大幅に削減し、CPUやエッジデバイスへの展開に適しています。

モデル特徴

IQ-DynamicGate超低位量子化
1-2ビット精度適応型量子化技術を採用し、Llama-3-8Bで検証済みで困惑度を43.9%低減可能
階層型量子化戦略
上位25%層と下位25%層にIQ4_XS、中間50%層にIQ2_XXS/IQ3_Sを使用し、重要なコンポーネントはQ5_K精度を維持
メモリ効率
量子化バージョンのメモリ使用量は最小2.1GBで、エッジデバイスや低VRAM GPUへの展開に適している
マルチフォーマット対応
BF16、F16及び様々な量子化フォーマット(Q4_KからQ8_0)を提供し、異なるハードウェア要件に対応

モデル能力

コード生成
低リソース環境推論
マルチ精度量子化推論

使用事例

開発ツール
コード補完
メモリ制約のあるIDEプラグインでインテリジェントなコード補完機能を提供
CPUデバイス上で低遅延応答を実現
エッジコンピューティング
デバイスサイドコード生成
Raspberry Piなどのエッジデバイスでコード生成サービスを実行
メモリ使用量を60%以上削減
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase