Q

Qwen3 14B Base

Developed by Qwen
通義千問シリーズ最新世代の大規模言語モデルで、148億パラメータの事前学習済みベースモデルを提供し、32kの超長文脈理解をサポート
Downloads 9,718
Release Time : 4/28/2025

Model Overview

Qwen3-14B-Baseは通義千問シリーズのベース事前学習モデルで、汎用言語モデリング能力に焦点を当て、特にプログラミング、STEM、論理的推論能力を強化

Model Features

多言語サポート
事前学習データは119言語の36兆トークンをカバーし、言語多様性は前世代の3倍
長文脈理解
32kの超長文脈トレーニングにより長文理解のボトルネックを突破
段階的事前学習
3段階のトレーニングパイプライン:汎用言語モデリング→STEM/プログラミング強化→長文専門トレーニング
アーキテクチャ最適化
qk層正規化技術と革新的なMoE負荷分散損失関数を採用し、トレーニング安定性を向上

Model Capabilities

多言語テキスト生成
プログラミングコード生成
論理的推論
STEM問題解答
長文書理解

Use Cases

コード支援
コード生成と補完
自然言語記述に基づいてプログラミングコードを生成
開発者の作業効率を向上
教育
STEM問題解答
数学、科学などの学問問題を解答
学習と研究を支援
企業アプリケーション
長文書分析
32k長さの契約書、レポートなどの文書を処理
文書処理効率を向上
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase