D

Deepseek Coder V2 Lite Instruct FP8

由 RedHatAI 开发
DeepSeek-Coder-V2-Lite-Instruct的FP8量化版本,适用于英语的商业和研究用途,优化了推理效率。
下载量 11.29k
发布时间 : 7/17/2024

模型简介

该模型是DeepSeek-Coder-V2-Lite-Instruct的量化版本,通过FP8权重量化和激活量化优化,适用于类似助手的聊天场景。

模型特点

FP8量化
权重和激活量化为FP8数据类型,减少磁盘大小和GPU内存需求约50%。
高效推理
适用于vLLM >= 0.5.2进行高效推理,优化了推理速度。
高准确率
在HumanEval+基准测试中表现优异,与未量化模型相比准确率相近。

模型能力

文本生成
代码生成
聊天助手

使用案例

商业和研究
代码生成助手
帮助开发者生成代码片段,提高开发效率。
在HumanEval+基准测试中平均得分为79.60。
聊天机器人
适用于类似助手的聊天场景,提供自然语言交互。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase