Q

Qwen3 30B A1.5B High Speed

DavidAUによって開発
Qwen3-30Bの高速最適化バージョンで、活性化エキスパート数を減らすことで推論速度を倍増させ、迅速な応答が必要なテキスト生成シナリオに適しています
ダウンロード数 179
リリース時間 : 5/3/2025

モデル概要

Qwen3-30B-A3B混合エキスパートモデルをファインチューニングし、活性化エキスパート数を8個から4個に削減することで、推論速度を大幅に向上させながらモデルの能力を維持

モデル特徴

高速推論
活性化エキスパート数を4個(総数128個)に削減することで、推論速度を約2倍向上
32K長文コンテキスト
32Kコンテキスト長+8K出力をサポートし、合計40K処理能力
多様な量子化フォーマット対応
GGUF、GPTQ、EXL2、AWQ、HQQなど多様な量子化フォーマットをサポート
効率的なリソース利用
1.5Bパラメータのみ活性化(総数30B)、CPU/GPUで優れたパフォーマンス

モデル能力

長文生成
複雑な推論
マルチターン対話
コード生成
クリエイティブライティング

使用事例

コンテンツ作成
SF小説創作
感情の深みを持つSF短編ストーリーを生成
800-1000字の完全なSFストーリー創作の例を提示
対話システム
深い思考対話
<think>タグを使用してAIの推論プロセスを表示
モデルは詳細な思考連鎖と内面の独白を表示可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase