Q

Qwen3 8B Base

由Qwen開發
Qwen3是通義千問系列最新一代大語言模型,提供完整的稠密模型與混合專家(MoE)模型體系,覆蓋119種語言的36萬億token預訓練數據。
下載量 26.79k
發布時間 : 4/28/2025

模型概述

Qwen3-8B-Base是一個82億參數的因果語言模型,專注於通用語言建模與專項能力強化,支持32k超長上下文理解。

模型特點

多語言覆蓋
預訓練數據覆蓋119種語言的36萬億token,語言覆蓋量達前代的三倍
專項能力強化
通過三階段預訓練策略強化STEM/編程/邏輯推理等專項能力
長文本理解
支持32k超長上下文處理,優化長文本理解能力
訓練技術創新
採用MoE全局批次負載均衡損失函數、全模型qk層歸一化等創新技術

模型能力

多語言文本生成
編程代碼生成
邏輯推理
長文本理解
STEM問題解答

使用案例

自然語言處理
多語言文本生成
生成多種語言的連貫文本內容
支持119種語言的流暢生成
技術文檔處理
解析和理解長篇幅技術文檔
32k上下文窗口支持完整文檔分析
編程輔助
代碼生成與補全
根據自然語言描述生成編程代碼
優化後的編程專項能力提供更準確的代碼輸出
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase