D

Deepseek R1 0528 Qwen3 8B GPTQ Int4 Int8Mix

由QuantTrio開發
基於DeepSeek-R1-0528-Qwen3-8B開發的量化版本模型,在推理能力、減少幻覺率等方面有顯著提升,適用於多種自然語言處理任務。
下載量 154
發布時間 : 5/30/2025

模型概述

該模型通過增加計算資源和引入算法優化機制,顯著提升了推理深度和推理能力,適用於數學、編程和通用邏輯等領域。

模型特點

推理能力增強
在各種基準評估中表現出色,包括數學、編程和通用邏輯等領域,整體性能接近領先模型。
準確率提高
在AIME 2025測試中,準確率從之前版本的70%提高到當前版本的87.5%。
幻覺率降低
減少了模型產生幻覺的概率。
功能調用支持增強
更好地支持函數調用。
編碼體驗優化
提供了更好的編碼體驗。

模型能力

文本生成
數學推理
編程輔助
邏輯推理
函數調用

使用案例

數學
AIME 2025測試
在AIME 2025測試中,準確率達到87.5%。
準確率從70%提升至87.5%
編程
LiveCodeBench測試
在LiveCodeBench (2408-2505)測試中,Pass@1達到73.3%。
Pass@1從63.5%提升至73.3%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase