モデル互換性テスト
お使いのデバイスが異なる規模のモデルを実行できるかチェック
企業展開サーバー構成計算機
企業展開に必要なサーバー構成を計算

デプロイメントパラメータ設定

個人開発
個人開発者や小規模プロジェクトに適している
チーム協力
中小規模チームに適している
本番環境
企業レベルの本番デプロイメントに適している
研究開発
大規模モデル研究に適している
1

モデルパラメータと量子化タイプ

モデルパラメータ
DeepSeek 7B
DeepSeek 14B
DeepSeek 32B
DeepSeek 70B
DeepSeek R1 671B
量子化タイプ
FP32(32-bit)
BF16(16-bit)
FP16(16-bit)
FP8(8-bit)
INT8(8-bit)
INT4(4-bit)
2

ランタイムパラメータ設定

シーケンス長: 32768
1K32K64K96K128K
バッチサイズ: 32
1163264128
GPU数: 8
1816324864

GPUメモリ分布

GPU 0
GPU 1
GPU 2
GPU 3
GPU 4
GPU 5
GPU 6
GPU 7
0.0GB
1.0GB
2.0GB
3.0GB
4.0GB
5.0GB
6.0GB
7.0GB
8.0GB
9.0GB
10.0GB
フレームワーク固定オーバーヘッド (1.00GB)
モデルパラメータ (7.00GB)
アクティベーション (0.70GB)
出力テンソル (1.16GB)

モデル詳細

隠れ層次元:8192
層数:80
アテンションヘッド数:64
KVヘッド数:8
最大位置エンコーディング:32768
語彙サイズ:128256
層あたりのパラメータ数:875.0M
総パラメータ計算:70000M
アテンション次元:128
FFN拡張比:3.50x
GQA比率:8.0:1

推奨設定

ハードウェア設定
利用可能なGPUを選択
現在の量子化: FP8
GPUモデルを選択
選択されたGPU
コンポーネント推奨設定
GPU8×NVIDIA RTX 4090 (24GB)
CPUAMD EPYC 7543 / Intel Xeon Silver 4314 32コア64スレッド
メモリ42GB DDR5 ECC-5600MHz Quad Channel
ネットワーク25Gbps (ネットワーク) + 64GB/s (PCIe) + 900GB/s (NVLink) 25Gb イーサネット
ストレージ245.71GB NVMe RAID
最適化FlashAttention-2 + INT8/8bit/FP8量子化 + ZeRO-2

GPU互換性チェック

互換性データなし、GPUを手動で選択してください

計算結果
フレームワーク固定オーバーヘッド
1.00 GB
フレームワーク初期化オーバーヘッド
モデルパラメータ
8.75 GB
パラメータ数 70 B × 精度 FP8(1 bytes) ÷ GPU数 8 = 8.75 GB/GPU
アクティベーション
2.19 GB
モデルパラメータ 70.00 GB × 動的係数 0.25 ÷ GPU数 8= 2.19 GB/GPU
出力テンソル
15.66 GB
バッチサイズ 32 × シーケンス長 32768 × 語彙サイズ 128,256 × 1 bytes ÷ (1024³) ÷ GPU数 8 = 15.66 GB/GPU
メモリ要件
220.75 GB
システム総メモリ要件
フレームワーク固定オーバーヘッド: 8.00 GB + 総パラメータ数: 70.00 GB + 総アクティベーション: 17.50 GB + 総出力テンソル: 125.25 GB = 220.75 GB
27.59 GB
GPUあたりメモリ要件
フレームワーク固定オーバーヘッド 1.00 GB + パラメータ数/GPU 8.75 GB + アクティベーション/GPU 2.19 GB + 出力テンソル/GPU 15.66 GB = 27.59 GB
AIBase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIBase