D

Deepseek R1 0528 GPTQ Int4 Int8Mix Compact

QuantTrioによって開発
DeepSeek-R1-0528モデルのGPTQ量子化バージョンで、Int4 + 選択的Int8の量子化方式を採用し、生成品質を保ちながらファイルサイズを縮小します。
ダウンロード数 258
リリース時間 : 6/1/2025

モデル概要

このモデルはDeepSeek-R1-0528の量子化バージョンで、Int4とInt8の混合量子化技術を通じて、モデルの推論速度とメモリ使用量を最適化し、さまざまなハードウェア構成のデプロイメントシナリオに適しています。

モデル特徴

混合量子化技術
Int4 + 選択的Int8の量子化方式を採用し、量子化に敏感な層のみInt8を使用し、それ以外の層はInt4を使用して、生成品質とファイルサイズをバランスさせます。
複数の量子化バリアント
Lite、Compact、Mediumの3種類の量子化バリアントを提供し、さまざまなハードウェア構成と品質要求に対応します。
最適化された推論性能
層ごとの細粒度量子化により、純粋なInt4量子化による推論精度の低下問題を大幅に軽減します。
強化された推論能力
前バージョンと比較して、複雑な推論タスクの処理能力が大幅に向上しており、数学問題やプログラミングの課題などにも対応できます。

モデル能力

複雑な論理推論
数学問題の解決
コード生成と理解
長文テキスト生成
多輪対話

使用事例

教育
数学コンテストの問題解決
AIMEなどの数学コンテストの問題を解く
AIME 2025テストでの正解率は87.5%
プログラミング教育
プログラミング学習とコードデバッグを支援する
LiveCodeBenchテストでのPass@1は73.3%
ソフトウェア開発
コード生成
要求に応じて高品質のコードを生成する
SWE Verifiedテストでの解決率は57.6%
コードレビュー
コードを分析して改善提案を提供する
研究
学術質問応答
複雑な学術問題に回答する
GPQA - DiamondテストでのPass@1は81.0%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase