模型相容性檢測
檢查您的設備是否能運行不同規模的模型
企業部署伺服器配置計算器
計算企業部署所需的伺服器配置
部署參數配置
個人開發
適合個人開發者或小型專案
團隊協作
適合中小型團隊使用
生產環境
適合企業級生產部署
研究研發
適合大規模模型研究
1
模型參數與量化類型
模型參數量
DeepSeek 7B
DeepSeek 14B
DeepSeek 32B
DeepSeek 70B
DeepSeek R1 671B
量化類型
FP32(32-bit)
BF16(16-bit)
FP16(16-bit)
FP8(8-bit)
INT8(8-bit)
INT4(4-bit)
2
運行參數配置
序列長度: 32768
批次大小: 32
GPU數量: 8
GPU顯存分布
模型詳情
隱藏層維度:8192
層數:80
注意力頭數:64
KV頭數:8
最大位置編碼:32768
詞表大小:128256
每層參數量:875.0M
總參數呈計算:70000M
注意力維度:128
FFN擴展比:3.50x
GQA比例:8.0:1
推薦配置
硬體配置
選擇可用GPU
當前量化: FP8
選擇GPU型號
已選擇的GPU
| 組件 | 推薦配置 | 
|---|---|
| GPU | 8×NVIDIA RTX 4090 (24GB) | 
| CPU | AMD EPYC 7543 / Intel Xeon Silver 4314 32核心64執行緒 | 
| 記憶體 | 42GB DDR5 ECC-5600MHz Quad Channel | 
| 網路 | 25Gbps (网络) + 64GB/s (PCIe) + 900GB/s (NVLink) 25Gb 乙太網路 | 
| 儲存 | 245.71GB NVMe RAID | 
| 優化方案 | FlashAttention-2 + INT8/8bit/FP8量化 + ZeRO-2 | 
GPU相容性檢查
暫無相容性資料,請手動選擇GPU
計算結果
框架固定開銷
1.00 GB
框架初始化開銷
模型參數
8.75 GB
參數量 70 B × 精度 FP8(1 bytes) ÷ GPU數量 8 = 8.75 GB/GPU
激活值
2.19 GB
模型參數 70.00 GB × 動態係數 0.25 ÷ GPU數量 8= 2.19 GB/GPU
輸出張量
15.66 GB
批次大小 32 × 序列長度 32768 × 詞表大小 128,256 × 1 bytes ÷ (1024³) ÷ GPU數量 8 = 15.66 GB/GPU
顯存需求
220.75 GB
系統總顯存需求
框架固定開銷: 8.00 GB + 總參數量: 70.00 GB + 總激活值: 17.50 GB + 總輸出張量: 125.25 GB = 220.75 GB
27.59 GB
每GPU顯存需求
框架固定開銷 1.00 GB + 參數量/GPU 8.75 GB + 激活值/GPU 2.19 GB + 輸出張量/GPU 15.66 GB = 27.59 GB