D

Deepseek R1 0528 Distilled Qwen3 Gguf

由 ertghiu256 开发
基于Qwen 3 4B参数模型微调,提升推理与问题解决能力
下载量 142
发布时间 : 6/16/2025

模型简介

该模型是基于Qwen 3 4B参数模型在特定数据集上微调而成,主要用于文本生成任务,增强了推理和问题解决能力

模型特点

训练加速
使用Unsloth和Huggingface的TRL库,训练速度提升2倍
多用途能力
支持通用推理、代码生成和问题解决等多种任务

模型能力

文本生成
逻辑推理
代码生成
问题解决

使用案例

推理与问题解决
通用推理
进行一般性的逻辑推理任务
代码生成
代码生成
生成编程代码(注意:未针对HTML代码进行专门训练)
生成的HTML代码可能效果不佳
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase