deepseek-r1-0528-distilled-qwen3-gguf開源模型 - 基於Qwen 3微調，增強推理與問題解決能力

Deepseek R1 0528 Distilled Qwen3 Gguf

由ertghiu256開發

基於Qwen 3 4B參數模型微調，提升推理與問題解決能力

下載量 142

發布時間 : 6/16/2025

模型概述

該模型是基於Qwen 3 4B參數模型在特定數據集上微調而成，主要用於文本生成任務，增強了推理和問題解決能力

訓練加速

使用Unsloth和Huggingface的TRL庫，訓練速度提升2倍

多用途能力

支持通用推理、代碼生成和問題解決等多種任務

文本生成

邏輯推理

代碼生成

問題解決

推理與問題解決

通用推理

進行一般性的邏輯推理任務

代碼生成

生成編程代碼(注意:未針對HTML代碼進行專門訓練)

生成的HTML代碼可能效果不佳

屬性	詳情
基礎模型	ertghiu256/deepseek - r1 - 0528 - distilled - qwen3
標籤	text - generation - inference、transformers、unsloth、qwen3、reasoning、think、deepseek
許可證	apache - 2.0
語言	en
數據集	sequelbox/Celestia3 - DeepSeek - R1 - 0528、LuyiCui/Mixture - of - Thoughts - processed
開發者	ertghiu256
微調基礎模型	unsloth/qwen3 - 4b - unsloth - bnb - 4bit