Q

Qwen3 4B 128K GGUF

由 unsloth 开发
Qwen3-4B是Qwen系列最新一代的大语言模型,具有4B参数规模,支持100多种语言,在推理、指令遵循、代理能力和多语言支持方面表现优异。
下载量 15.41k
发布时间 : 4/28/2025

模型简介

Qwen3-4B是一个4B参数的因果语言模型,支持思维模式和非思维模式的切换,适用于复杂逻辑推理、数学计算、代码生成和通用对话等多种场景。

模型特点

思维模式切换
支持在思维模式(用于复杂推理)和非思维模式(用于高效对话)间无缝切换
增强推理能力
在数学、代码生成和常识逻辑推理方面表现优异
多语言支持
支持100多种语言和方言,具备强大的多语言指令遵循和翻译能力
长上下文支持
原生支持32,768个token,通过YaRN扩展可支持131,072个token

模型能力

文本生成
代码生成
数学推理
多轮对话
多语言翻译
工具集成

使用案例

教育
数学问题解答
帮助学生解决复杂的数学问题,展示推理过程
提高学习效率,增强理解能力
开发
代码生成与调试
根据需求生成代码片段或帮助调试现有代码
提高开发效率,减少编码错误
商业
多语言客服
提供多语言的客户服务对话支持
降低人力成本,提高服务响应速度
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase