D

Deepseek R1 0528 Distilled Qwen3 Gguf

由ertghiu256開發
基於Qwen 3 4B參數模型微調,提升推理與問題解決能力
下載量 142
發布時間 : 6/16/2025

模型概述

該模型是基於Qwen 3 4B參數模型在特定數據集上微調而成,主要用於文本生成任務,增強了推理和問題解決能力

模型特點

訓練加速
使用Unsloth和Huggingface的TRL庫,訓練速度提升2倍
多用途能力
支持通用推理、代碼生成和問題解決等多種任務

模型能力

文本生成
邏輯推理
代碼生成
問題解決

使用案例

推理與問題解決
通用推理
進行一般性的邏輯推理任務
代碼生成
代碼生成
生成編程代碼(注意:未針對HTML代碼進行專門訓練)
生成的HTML代碼可能效果不佳
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase