Q

Qwen3 14B Base

Developed by Qwen
通義千問系列最新一代大語言模型,提供148億參數的預訓練基礎模型,支持32k超長上下文理解
Downloads 9,718
Release Time : 4/28/2025

Model Overview

Qwen3-14B-Base是通義千問系列的基礎預訓練模型,專注於通用語言建模能力,特別強化了編程、STEM和邏輯推理能力

Model Features

多語言支持
預訓練數據覆蓋119種語言的36萬億token,語言多樣性達前代的三倍
長上下文理解
通過32k超長上下文訓練突破長文本理解瓶頸
漸進式預訓練
三階段訓練管線:通用語言建模→STEM/編程強化→長文本專項訓練
架構優化
採用qk層歸一化技術和創新的MoE負載均衡損失函數,提升訓練穩定性

Model Capabilities

多語言文本生成
編程代碼生成
邏輯推理
STEM問題解答
長文檔理解

Use Cases

代碼輔助
代碼生成與補全
根據自然語言描述生成編程代碼
提升開發者工作效率
教育
STEM問題解答
解答數學、科學等學科問題
輔助學習與研究
企業應用
長文檔分析
處理32k長度的合同、報告等文檔
提升文檔處理效率
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase