D

Deepseek R1 Distill Llama 3B

Developed by suayptalha
DeepSeek-R1-Distill-Llama-3B 是基於 Llama-3.2-3B 模型,使用 R1-Distill-SFT 數據集對 DeepSeek-R1 進行蒸餾得到的版本,具備文本生成能力。
Downloads 781
Release Time : 2/23/2025

Model Overview

該模型是通過蒸餾 Llama-3.2-3B 模型並結合 R1-Distill-SFT 數據集訓練而成,主要用於文本生成任務。

Model Features

基於 Llama-3.2-3B 蒸餾
通過蒸餾技術優化了 Llama-3.2-3B 模型,提升了性能。
支持 Llama3 提示模板
兼容 Llama3 的提示模板,便於用戶使用。
文本生成能力
在多個文本生成任務中表現良好。

Model Capabilities

文本生成
推理能力
多輪對話

Use Cases

問答系統
數值比較
比較兩個數值的大小,並提供推理過程。
模型能夠正確比較數值並輸出詳細的推理過程。
教育輔助
數學問題解答
解答基礎數學問題,並展示推理步驟。
模型能夠解答問題並展示清晰的推理過程。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase