D

Deepseek R1 0528 GPTQ Int4 Int8Mix Compact

由 QuantTrio 开发
DeepSeek-R1-0528模型的GPTQ量化版本,采用Int4 + 选择性Int8的量化方案,在保证生成质量的同时减小文件大小。
下载量 258
发布时间 : 6/1/2025

模型简介

该模型是DeepSeek-R1-0528的量化版本,通过混合Int4和Int8量化技术,优化了模型推理速度和显存占用,适用于不同硬件配置的部署场景。

模型特点

混合量化技术
采用Int4 + 选择性Int8的量化方案,仅对量化敏感的层采用Int8,其余层使用Int4,平衡生成质量和文件大小。
多量化变体
提供Lite、Compact和Medium三种量化变体,适应不同硬件配置和质量要求。
优化的推理性能
通过逐层细粒度量化,显著缓解纯Int4量化导致的推理准确性下降问题。
增强的推理能力
相比前版本,在处理复杂推理任务方面有显著改进,如数学问题和编程挑战。

模型能力

复杂逻辑推理
数学问题求解
代码生成与理解
长文本生成
多轮对话

使用案例

教育
数学竞赛解题
解决AIME等数学竞赛题目
AIME 2025测试中准确率达87.5%
编程教学
辅助编程学习和代码调试
LiveCodeBench测试中Pass@1达73.3%
软件开发
代码生成
根据需求生成高质量代码
SWE Verified测试中解决率达57.6%
代码审查
分析代码并提供改进建议
研究
学术问答
回答复杂学术问题
GPQA-Diamond测试中Pass@1达81.0%
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase