D

Deepseek R1 0528 AWQ

由 adamo1139 开发
DeepSeek-R1-0528 671B模型的4位AWQ量化版本,适合在高端GPU节点上使用
下载量 161
发布时间 : 5/31/2025

模型简介

这是DeepSeek-R1-0528 671B模型的4位AWQ量化版本,适合搭配vLLM和SGLang在8xA100/8xH20/8xH100等GPU节点上使用。

模型特点

高性能推理
在数学、编程和通用逻辑等各种基准评估中表现出色,整体性能接近O3和Gemini 2.5 Pro等领先模型
量化优化
使用4位AWQ量化技术,降低模型运行时的内存需求,同时保持较高的性能
增强的推理深度
通过后期训练中的算法优化机制,显著提升了推理深度和推理能力
降低幻觉率
相比前版本,新版本降低了幻觉率,提供更准确的回答

模型能力

复杂数学问题求解
编程代码生成
逻辑推理
多轮对话
文件内容分析
网页搜索结果整合

使用案例

教育
数学竞赛题解答
解答AIME、HMMT等数学竞赛题目
在AIME 2025测试中准确率达到87.5%
编程
代码生成与优化
生成和优化编程代码
在LiveCodeBench测试中Pass@1达到73.3%
研究
学术研究辅助
帮助研究人员进行文献综述和数据分析
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase