D

Deepseek R1 0528 GPTQ Int4 Int8Mix Compact

由QuantTrio開發
DeepSeek-R1-0528模型的GPTQ量化版本,採用Int4 + 選擇性Int8的量化方案,在保證生成質量的同時減小文件大小。
下載量 258
發布時間 : 6/1/2025

模型概述

該模型是DeepSeek-R1-0528的量化版本,通過混合Int4和Int8量化技術,優化了模型推理速度和顯存佔用,適用於不同硬件配置的部署場景。

模型特點

混合量化技術
採用Int4 + 選擇性Int8的量化方案,僅對量化敏感的層採用Int8,其餘層使用Int4,平衡生成質量和文件大小。
多量化變體
提供Lite、Compact和Medium三種量化變體,適應不同硬件配置和質量要求。
優化的推理性能
通過逐層細粒度量化,顯著緩解純Int4量化導致的推理準確性下降問題。
增強的推理能力
相比前版本,在處理複雜推理任務方面有顯著改進,如數學問題和編程挑戰。

模型能力

複雜邏輯推理
數學問題求解
代碼生成與理解
長文本生成
多輪對話

使用案例

教育
數學競賽解題
解決AIME等數學競賽題目
AIME 2025測試中準確率達87.5%
編程教學
輔助編程學習和代碼調試
LiveCodeBench測試中Pass@1達73.3%
軟件開發
代碼生成
根據需求生成高質量代碼
SWE Verified測試中解決率達57.6%
代碼審查
分析代碼並提供改進建議
研究
學術問答
回答複雜學術問題
GPQA-Diamond測試中Pass@1達81.0%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase