D

Deepseek R1 Distill Llama 3B

由 suayptalha 开发
DeepSeek-R1-Distill-Llama-3B 是基于 Llama-3.2-3B 模型,使用 R1-Distill-SFT 数据集对 DeepSeek-R1 进行蒸馏得到的版本,具备文本生成能力。
下载量 781
发布时间 : 2/23/2025

模型简介

该模型是通过蒸馏 Llama-3.2-3B 模型并结合 R1-Distill-SFT 数据集训练而成,主要用于文本生成任务。

模型特点

基于 Llama-3.2-3B 蒸馏
通过蒸馏技术优化了 Llama-3.2-3B 模型,提升了性能。
支持 Llama3 提示模板
兼容 Llama3 的提示模板,便于用户使用。
文本生成能力
在多个文本生成任务中表现良好。

模型能力

文本生成
推理能力
多轮对话

使用案例

问答系统
数值比较
比较两个数值的大小,并提供推理过程。
模型能够正确比较数值并输出详细的推理过程。
教育辅助
数学问题解答
解答基础数学问题,并展示推理步骤。
模型能够解答问题并展示清晰的推理过程。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase