D

Deepseek Coder V2 Lite Instruct FP8

由RedHatAI開發
DeepSeek-Coder-V2-Lite-Instruct的FP8量化版本,適用於英語的商業和研究用途,優化了推理效率。
下載量 11.29k
發布時間 : 7/17/2024

模型概述

該模型是DeepSeek-Coder-V2-Lite-Instruct的量化版本,通過FP8權重量化和激活量化優化,適用於類似助手的聊天場景。

模型特點

FP8量化
權重和激活量化為FP8數據類型,減少磁盤大小和GPU內存需求約50%。
高效推理
適用於vLLM >= 0.5.2進行高效推理,優化了推理速度。
高準確率
在HumanEval+基準測試中表現優異,與未量化模型相比準確率相近。

模型能力

文本生成
代碼生成
聊天助手

使用案例

商業和研究
代碼生成助手
幫助開發者生成代碼片段,提高開發效率。
在HumanEval+基準測試中平均得分為79.60。
聊天機器人
適用於類似助手的聊天場景,提供自然語言交互。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase