D

Deepseek R1 GGUF

由unsloth開發
DeepSeek-R1是由Unsloth優化的1.58-bit動態量化大語言模型,採用MoE架構,支持英語任務處理
下載量 2.0M
發布時間 : 1/20/2025

模型概述

基於DeepSeek-R1的量化版本,通過Unsloth的1.58-bit + 2-bit動態量化技術實現高效推理,特別優化了MoE層量化策略

模型特點

動態混合量化
採用1.58-bit + 2-bit動態量化技術,對MoE層進行選擇性量化,精度優於標準1-bit/2-bit方案
多版本量化支持
提供1.58bit到2.51bit四種量化方案,平衡磁盤佔用與推理精度
GPU加速優化
支持通過llama.cpp進行GPU層卸載,在RTX 4090等設備上實現加速推理

模型能力

英語文本生成
指令跟隨
代碼理解與生成

使用案例

開發輔助
代碼生成
根據自然語言描述生成Python等編程語言代碼
示例展示Flappy Bird遊戲實現代碼生成能力
內容創作
技術文檔翻譯
中英技術文檔的互譯處理
支持通過特定提示模板實現結構化翻譯
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase