Q

Qwen3 4B Base

Qwenによって開発
Qwen3-4B-Baseは通義千問シリーズ最新世代の40億パラメータ大規模言語モデルで、36兆トークンの多言語データで事前学習され、32kのコンテキスト長をサポートします。
ダウンロード数 50.84k
リリース時間 : 4/28/2025

モデル概要

Qwen3-4B-Baseは因果言語モデルで、汎用的な言語理解と生成タスクに特化しており、テキスト生成やコード補完など様々なシナリオに適用可能です。

モデル特徴

大規模多言語事前学習
36兆トークンの119言語データで事前学習され、言語カバレッジは前世代の3倍に達します
3段階トレーニング最適化
汎用言語モデリング→専門能力強化→長文脈トレーニングの3段階事前学習パラダイムを採用
長文脈サポート
32kトークンの超長文脈処理能力をサポート
効率的な注意メカニズム
グループ化クエリ注意(GQA)アーキテクチャを採用し、クエリヘッド32グループ/キーバリューヘッド8グループ構成

モデル能力

テキスト生成
多言語理解
コード補完
論理的推論
長文処理

使用事例

自然言語処理
多言語テキスト生成
複数言語の一貫性のあるテキストコンテンツを生成
119言語の流暢な生成をサポート
技術文書処理
STEM分野の技術文書やコードを処理
コードとSTEM分野データに対して特別な最適化を実施
開発支援
コード補完
プログラマーのコード作成と補完を支援
事前学習データにおけるコード関連データの比率を向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase