Q

Qwen3 4B Base

Developed by unsloth
Qwen3-4B-Base是通义千问系列最新一代40亿参数量的预训练语言模型,支持32k上下文长度和多语言处理。
Downloads 15.15k
Release Time : 4/28/2025

Model Overview

基于创新的三阶段预训练范式开发的大语言模型,专注于通用语言建模、STEM/编程/逻辑推理能力强化以及长文本理解。

Model Features

多语言覆盖
预训练数据覆盖119种语言的36万亿token,语言覆盖范围达前代的三倍
三阶段预训练
分阶段强化通用语言能力、STEM/编程/逻辑推理能力以及长文本理解能力
长上下文支持
支持32,768 tokens的超长上下文处理能力
训练技术创新
采用MoE负载均衡损失、全模型qk层归一化等技术提升训练稳定性

Model Capabilities

多语言文本生成
长文本理解
编程代码生成
逻辑推理
STEM问题解答

Use Cases

智能助手
多语言客服机器人
构建支持多语言的智能客服系统
可处理119种语言的用户查询
教育科技
编程学习助手
辅助编程学习者理解代码和解决问题
强化后的编程能力可提供更准确的代码解释
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase