Qwen3 30B A3B Base
Qwen3-30B-A3B-Baseは通義千問シリーズ最新世代の30.5Bパラメータ規模の混合エキスパート(MoE)大規模言語モデルで、119言語と32kの文脈長をサポートします。
ダウンロード数 9,745
リリース時間 : 4/28/2025
モデル概要
3段階の事前学習フレームワークに基づいて開発されたMoEアーキテクチャの大規模言語モデルで、汎用言語モデリング、STEM/プログラミング能力の強化、長文脈理解に焦点を当てています。
モデル特徴
多言語カバレッジ
事前学習データは119言語の36兆トークンをカバーし、言語カバレッジは前世代の3倍に達します
MoEアーキテクチャの最適化
グローバルバッチ負荷分散損失とqk層正規化技術を採用し、学習の安定性を向上させます
3段階事前学習
段階的に汎用能力、STEM/プログラミング/推論能力、長文脈理解を強化します
モデル能力
多言語テキスト生成
コード生成と補完
複雑な論理的推論
長文書理解
数学的問題解決
使用事例
開発支援
コード自動補完
複数のプログラミング言語のコード生成とエラー修正をサポート
教育研究
STEM問題解決
数学、物理などの複雑な問題を解答
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98