Q

Qwen3 4B Base

由unsloth開發
Qwen3-4B-Base是通義千問系列最新一代40億參數量的預訓練語言模型,支持32k上下文長度和多語言處理。
下載量 15.15k
發布時間 : 4/28/2025

模型概述

基於創新的三階段預訓練範式開發的大語言模型,專注於通用語言建模、STEM/編程/邏輯推理能力強化以及長文本理解。

模型特點

多語言覆蓋
預訓練數據覆蓋119種語言的36萬億token,語言覆蓋範圍達前代的三倍
三階段預訓練
分階段強化通用語言能力、STEM/編程/邏輯推理能力以及長文本理解能力
長上下文支持
支持32,768 tokens的超長上下文處理能力
訓練技術創新
採用MoE負載均衡損失、全模型qk層歸一化等技術提升訓練穩定性

模型能力

多語言文本生成
長文本理解
編程代碼生成
邏輯推理
STEM問題解答

使用案例

智能助手
多語言客服機器人
構建支持多語言的智能客服系統
可處理119種語言的用戶查詢
教育科技
編程學習助手
輔助編程學習者理解代碼和解決問題
強化後的編程能力可提供更準確的代碼解釋
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase