D

Deepseek R1 FP4

nvidiaによって開発
DeepSeek R1モデルのFP4量子化バージョン、最適化されたTransformerアーキテクチャで効率的なテキスト生成を実現
ダウンロード数 61.51k
リリース時間 : 2/21/2025

モデル概要

DeepSeek R1ベースのFP4量子化モデル、TensorRT-LLM推論向けに最適化、128K長文コンテキスト生成をサポート

モデル特徴

FP4量子化技術
TensorRTモデルオプティマイザによる重みと活性値のFP4量子化を実現、ストレージ要件を1.6倍削減
長文コンテキストサポート
128Kトークンの超長文コンテキスト処理能力をサポート
Blackwellアーキテクチャ最適化
NVIDIA Blackwell GPUアーキテクチャ向けに最適化された推論性能

モデル能力

テキスト生成
長文理解
知識QA

使用事例

コンテンツ生成
記事続き作成
与えられた冒頭文から一貫性のある続きを自動生成
知識QA
事実質問応答
世界知識に関する様々な質問に回答
MMLUベンチマークで90.7%の精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase