模型兼容性检测
检查你的设备是否能运行不同规模的模型
企业部署服务器配置计算器
计算企业部署所需的服务器配置
部署参数配置
个人开发
适合个人开发者或小型项目
团队协作
适合中小型团队使用
生产环境
适合企业级生产部署
研究研发
适合大规模模型研究
1
模型参数与量化类型
模型参数量
DeepSeek 7B
DeepSeek 14B
DeepSeek 32B
DeepSeek 70B
DeepSeek R1 671B
量化类型
FP32(32-bit)
BF16(16-bit)
FP16(16-bit)
FP8(8-bit)
INT8(8-bit)
INT4(4-bit)
2
运行参数配置
序列长度: 32768
批次大小: 32
GPU数量: 8
GPU显存分布
模型详情
隐藏层维度:8192
层数:80
注意力头数:64
KV头数:8
最大位置编码:32768
词表大小:128256
每层参数量:875.0M
总参数呈计算:70000M
注意力维度:128
FFN扩展比:3.50x
GQA比例:8.0:1
推荐配置
硬件配置
选择可用GPU
当前量化: FP8
选择GPU型号
已选择的GPU
| 组件 | 推荐配置 | 
|---|---|
| GPU | 8×NVIDIA RTX 4090 (24GB) | 
| CPU | AMD EPYC 7543 / Intel Xeon Silver 4314 32核64线程 | 
| 内存 | 42GB DDR5 ECC-5600MHz Quad Channel | 
| 网络 | 25Gbps (网络) + 64GB/s (PCIe) + 900GB/s (NVLink) 25Gb 以太网 | 
| 存储 | 245.71GB NVMe RAID | 
| 优化方案 | FlashAttention-2 + INT8/8bit/FP8量化 + ZeRO-2 | 
GPU兼容性检查
暂无兼容性数据,请手动选择GPU
计算结果
框架固定开销
1.00 GB
框架初始化开销
模型参数
8.75 GB
参数量 70 B × 精度 FP8(1 bytes) ÷ GPU数量 8 = 8.75 GB/GPU
激活值
2.19 GB
模型参数 70.00 GB × 动态系数 0.25 ÷ GPU数量 8= 2.19 GB/GPU
输出张量
15.66 GB
批次大小 32 × 序列长度 32768 × 词表大小 128,256 × 1 bytes ÷ (1024³) ÷ GPU数量 8 = 15.66 GB/GPU
显存需求
220.75 GB
系统总显存需求
框架固定开销: 8.00 GB + 总参数量: 70.00 GB + 总激活值: 17.50 GB + 总输出张量: 125.25 GB = 220.75 GB
27.59 GB
每GPU显存需求
框架固定开销 1.00 GB + 参数量/GPU 8.75 GB + 激活值/GPU 2.19 GB + 输出张量/GPU 15.66 GB = 27.59 GB