D

Deepseek V3 0324 GGUF

ubergarmによって開発
現在のV3-0324モデルはこのサイズカテゴリで最高性能の量子化バージョンであり、Q8_0に近い性能を維持しながら大幅にサイズを削減
ダウンロード数 1,712
リリース時間 : 3/26/2025

モデル概要

高性能量子化言語モデル、32kトークンの長文脈処理をサポート、GPU VRAM最適化専用設計

モデル特徴

効率的なVRAM利用
MLA技術によるVRAM最適化を採用、32k文脈を24GB VRAM内で動作可能
高品質量子化
新世代重要度マトリックスとIQx_K_R4量子化技術を使用し、オリジナルモデルに近い性能を維持
モジュラー量子化戦略
異なる層(単語埋め込み/注意/エキスパート層)に対して差異化された量子化スキームを適用

モデル能力

長文生成
コード理解と生成
多言語処理

使用事例

テキスト処理
長文書要約
32kトークンまでの文書を処理して要約を生成
コードアシスト
コード補完
文脈に基づいたコード提案を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase