D

Deepseek R1 0528 FP4

由nvidia開發
DeepSeek AI 公司的 DeepSeek R1 0528 模型的量化版本,基於優化的 Transformer 架構的自迴歸語言模型,可用於商業和非商業用途。
下載量 372
發布時間 : 6/3/2025

模型概述

該模型是 DeepSeek R1 0528 的 FP4 量化版本,減少了磁盤大小和 GPU 內存需求,適用於文本生成任務。

模型特點

FP4 量化
通過將權重和激活量化為 FP4 數據類型,減少存儲和計算資源需求,使磁盤大小和 GPU 內存需求減少約 1.6 倍。
優化的 Transformer 架構
基於優化的 Transformer 架構,是自迴歸語言模型,適用於高效的文本生成任務。
商業和非商業用途
模型可用於商業和非商業用途,遵循 MIT 許可證。

模型能力

文本生成
語言模型推理

使用案例

文本生成
基礎文本補全
根據給定的提示生成連貫的文本補全。
生成符合上下文的連貫文本。
問答系統
回答用戶提出的問題,如事實性問題或推理問題。
生成準確或合理的答案。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase