D

Deepseek R1 0528 Quantized.w4a16

由 RedHatAI 开发
经过量化处理的DeepSeek-R1-0528模型,通过将权重量化为INT4数据类型,显著降低了GPU内存和磁盘空间的需求。
下载量 126
发布时间 : 5/30/2025

模型简介

该模型是基于DeepSeek-R1-0528的量化版本,主要用于文本生成任务,通过权重量化优化了资源使用效率。

模型特点

INT4权重量化
将权重从8位减少到4位,显著降低GPU内存和磁盘空间需求约50%。
高效部署
支持使用vLLM后端高效部署,优化推理速度。
高性能推理
在多个推理任务上表现接近原始模型,准确率损失极小。

模型能力

文本生成
高效推理

使用案例

学术研究
数学问题求解
用于解决复杂的数学问题,如MATH-500数据集中的题目。
pass@1准确率97.40%
通用知识问答
回答GPQA Diamond数据集中的高难度问题。
pass@1准确率80.61%
教育
AIME竞赛题解答
生成美国数学邀请赛(AIME)题目的解答。
pass@1准确率87.33%
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase