Q

Qwen3 1.7B Base

由Qwen開發
Qwen3-1.7B是通義千問系列最新一代17億參數基礎語言模型,採用三階段預訓練體系,支持32k上下文長度。
下載量 19.24k
發布時間 : 4/28/2025

模型概述

基於36萬億token多語言數據預訓練的因果語言模型,專注通用語言建模與專項能力強化。

模型特點

多階段預訓練體系
三階段訓練流程:通用語言建模→STEM/編程專項強化→32k長上下文適應
超大規模語料
基於36萬億token的119種語言數據,覆蓋編程/STEM/推理等多領域
訓練技術創新
採用全局批次負載均衡損失和qk層歸一化技術提升訓練穩定性

模型能力

多語言文本生成
長文本理解(32k上下文)
編程代碼生成
邏輯推理
STEM問題解答

使用案例

智能助手
多輪對話系統
支持長上下文記憶的對話應用
教育
STEM解題輔導
數學/科學問題分步解答
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase