deepseek-r1-0528-distilled-qwen3-gguf开源模型 - 基于Qwen 3微调，增强推理与问题解决能力

Deepseek R1 0528 Distilled Qwen3 Gguf

由 ertghiu256 开发

基于Qwen 3 4B参数模型微调，提升推理与问题解决能力

下载量 142

发布时间 : 6/16/2025

模型简介

该模型是基于Qwen 3 4B参数模型在特定数据集上微调而成，主要用于文本生成任务，增强了推理和问题解决能力

训练加速

使用Unsloth和Huggingface的TRL库，训练速度提升2倍

多用途能力

支持通用推理、代码生成和问题解决等多种任务

文本生成

逻辑推理

代码生成

问题解决

推理与问题解决

通用推理

进行一般性的逻辑推理任务

代码生成

生成编程代码(注意:未针对HTML代码进行专门训练)

生成的HTML代码可能效果不佳

属性	详情
基础模型	ertghiu256/deepseek - r1 - 0528 - distilled - qwen3
标签	text - generation - inference、transformers、unsloth、qwen3、reasoning、think、deepseek
许可证	apache - 2.0
语言	en
数据集	sequelbox/Celestia3 - DeepSeek - R1 - 0528、LuyiCui/Mixture - of - Thoughts - processed
开发者	ertghiu256
微调基础模型	unsloth/qwen3 - 4b - unsloth - bnb - 4bit