D

Deepseek R1 FP4

由nvidia開發
DeepSeek R1模型的FP4量化版本,採用優化後的Transformer架構實現高效文本生成
下載量 61.51k
發布時間 : 2/21/2025

模型概述

基於DeepSeek R1的FP4量化模型,專為TensorRT-LLM推理優化,支持128K長上下文生成

模型特點

FP4量化技術
通過TensorRT模型優化器實現權重和激活值的FP4量化,存儲需求降低1.6倍
長上下文支持
支持128K tokens的超長上下文處理能力
Blackwell架構優化
專為NVIDIA Blackwell GPU架構優化的推理性能

模型能力

文本生成
長文本理解
知識問答

使用案例

內容生成
文章續寫
根據給定開頭自動生成連貫的後續內容
知識問答
事實性問答
回答關於世界知識的各類問題
在MMLU基準測試中達到90.7%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase