D

Deepseek R1 0528 AWQ

由adamo1139開發
DeepSeek-R1-0528 671B模型的4位AWQ量化版本,適合在高端GPU節點上使用
下載量 161
發布時間 : 5/31/2025

模型概述

這是DeepSeek-R1-0528 671B模型的4位AWQ量化版本,適合搭配vLLM和SGLang在8xA100/8xH20/8xH100等GPU節點上使用。

模型特點

高性能推理
在數學、編程和通用邏輯等各種基準評估中表現出色,整體性能接近O3和Gemini 2.5 Pro等領先模型
量化優化
使用4位AWQ量化技術,降低模型運行時的內存需求,同時保持較高的性能
增強的推理深度
通過後期訓練中的算法優化機制,顯著提升了推理深度和推理能力
降低幻覺率
相比前版本,新版本降低了幻覺率,提供更準確的回答

模型能力

複雜數學問題求解
編程代碼生成
邏輯推理
多輪對話
文件內容分析
網頁搜索結果整合

使用案例

教育
數學競賽題解答
解答AIME、HMMT等數學競賽題目
在AIME 2025測試中準確率達到87.5%
編程
代碼生成與優化
生成和優化編程代碼
在LiveCodeBench測試中Pass@1達到73.3%
研究
學術研究輔助
幫助研究人員進行文獻綜述和數據分析
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase