D

Deepseek R1 FP4

由 nvidia 开发
DeepSeek R1模型的FP4量化版本,采用优化后的Transformer架构实现高效文本生成
下载量 61.51k
发布时间 : 2/21/2025

模型简介

基于DeepSeek R1的FP4量化模型,专为TensorRT-LLM推理优化,支持128K长上下文生成

模型特点

FP4量化技术
通过TensorRT模型优化器实现权重和激活值的FP4量化,存储需求降低1.6倍
长上下文支持
支持128K tokens的超长上下文处理能力
Blackwell架构优化
专为NVIDIA Blackwell GPU架构优化的推理性能

模型能力

文本生成
长文本理解
知识问答

使用案例

内容生成
文章续写
根据给定开头自动生成连贯的后续内容
知识问答
事实性问答
回答关于世界知识的各类问题
在MMLU基准测试中达到90.7%准确率
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase