D

Deepseek R1 0528 FP4

由 nvidia 开发
DeepSeek AI 公司的 DeepSeek R1 0528 模型的量化版本,基于优化的 Transformer 架构的自回归语言模型,可用于商业和非商业用途。
下载量 372
发布时间 : 6/3/2025

模型简介

该模型是 DeepSeek R1 0528 的 FP4 量化版本,减少了磁盘大小和 GPU 内存需求,适用于文本生成任务。

模型特点

FP4 量化
通过将权重和激活量化为 FP4 数据类型,减少存储和计算资源需求,使磁盘大小和 GPU 内存需求减少约 1.6 倍。
优化的 Transformer 架构
基于优化的 Transformer 架构,是自回归语言模型,适用于高效的文本生成任务。
商业和非商业用途
模型可用于商业和非商业用途,遵循 MIT 许可证。

模型能力

文本生成
语言模型推理

使用案例

文本生成
基础文本补全
根据给定的提示生成连贯的文本补全。
生成符合上下文的连贯文本。
问答系统
回答用户提出的问题,如事实性问题或推理问题。
生成准确或合理的答案。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase