DeepSeekサーバー構成計算ツール-AIモデル展開ハードウェア要件

モデル互換性テスト

お使いのデバイスが異なる規模のモデルを実行できるかチェック

企業展開サーバー構成計算機

企業展開に必要なサーバー構成を計算

デプロイメントパラメータ設定

個人開発

個人開発者や小規模プロジェクトに適している

チーム協力

中小規模チームに適している

本番環境

企業レベルの本番デプロイメントに適している

研究開発

大規模モデル研究に適している

モデルパラメータと量子化タイプ

モデルパラメータ

DeepSeek 7B

DeepSeek 14B

DeepSeek 32B

DeepSeek 70B

DeepSeek R1 671B

量子化タイプ

FP32(32-bit)

BF16(16-bit)

FP16(16-bit)

FP8(8-bit)

INT8(8-bit)

INT4(4-bit)

ランタイムパラメータ設定

シーケンス長: 32768

1K32K64K96K128K

バッチサイズ: 32

1163264128

GPU数: 8

1816324864

GPUメモリ分布

GPU 0

GPU 1

GPU 2

GPU 3

GPU 4

GPU 5

GPU 6

GPU 7

0.0GB

1.0GB

2.0GB

3.0GB

4.0GB

5.0GB

6.0GB

7.0GB

8.0GB

9.0GB

10.0GB

フレームワーク固定オーバーヘッド (1.00GB)

モデルパラメータ (7.00GB)

アクティベーション (0.70GB)

出力テンソル (1.16GB)

モデル詳細

隠れ層次元:8192

層数:80

アテンションヘッド数:64

KVヘッド数:8

最大位置エンコーディング:32768

語彙サイズ:128256

層あたりのパラメータ数:875.0M

総パラメータ計算:70000M

アテンション次元:128

FFN拡張比:3.50x

GQA比率:8.0:1

推奨設定

ハードウェア設定

利用可能なGPUを選択

GPUタイプ

オプションGPU

現在の量子化: FP8

GPUモデルを選択

選択されたGPU

コンポーネント	推奨設定
GPU	8×NVIDIA RTX 4090 (24GB)

CPU	AMD EPYC 7543 / Intel Xeon Silver 4314 32コア64スレッド

メモリ	42GB DDR5 ECC-5600MHz Quad Channel

ネットワーク	25Gbps (ネットワーク) + 64GB/s (PCIe) + 900GB/s (NVLink) 25Gb イーサネット

ストレージ	245.71GB NVMe RAID

最適化	FlashAttention-2 + INT8/8bit/FP8量子化 + ZeRO-2

GPU互換性チェック

互換性データなし、GPUを手動で選択してください

計算結果

フレームワーク固定オーバーヘッド

1.00 GB

フレームワーク初期化オーバーヘッド

モデルパラメータ

8.75 GB

パラメータ数 70 B × 精度 FP8(1 bytes) ÷ GPU数 8 = 8.75 GB/GPU

アクティベーション

2.19 GB

モデルパラメータ 70.00 GB × 動的係数 0.25 ÷ GPU数 8= 2.19 GB/GPU

出力テンソル

15.66 GB

バッチサイズ 32 × シーケンス長 32768 × 語彙サイズ 128,256 × 1 bytes ÷ (1024³) ÷ GPU数 8 = 15.66 GB/GPU

メモリ要件

220.75 GB

システム総メモリ要件

フレームワーク固定オーバーヘッド: 8.00 GB + 総パラメータ数: 70.00 GB + 総アクティベーション: 17.50 GB + 総出力テンソル: 125.25 GB = 220.75 GB

27.59 GB

GPUあたりメモリ要件

フレームワーク固定オーバーヘッド 1.00 GB + パラメータ数/GPU 8.75 GB + アクティベーション/GPU 2.19 GB + 出力テンソル/GPU 15.66 GB = 27.59 GB

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご