Q

Qwen3 30B A1.5B 64K High Speed NEO Imatrix MAX Gguf

DavidAUによって開発
Qwen3-30B-A3Bエキスパート混合モデルの最適化バージョンで、活性化エキスパート数を減らすことで速度を向上させ、64kのコンテキスト長をサポートし、様々なテキスト生成タスクに適しています。
ダウンロード数 508
リリース時間 : 5/11/2025

モデル概要

このモデルはQwen3-30B-A3Bの微調整バージョンで、活性化エキスパート数を8個から4個(総計128エキスパート)に減らし、推論速度を大幅に向上させました。クリエイティブライティング、問題解決、深い推論など、様々なテキスト生成シナリオに適しています。

モデル特徴

高速推論
活性化エキスパート数を減らすことで、推論速度が約2倍に向上し、CPU実行速度は23トークン/秒、GPU実行速度は125+トークン/秒に達します。
64kコンテキスト
YARN技術によりコンテキスト長を64k(65535)に拡張し、長文タスクの処理に適しています。
多量子化バージョンサポート
IQ1_M MAX、IQ2、Q4KSなど様々な量子化バージョンを提供し、異なるハードウェア環境(GPU/CPU)に対応しています。
エキスパート混合構造
モデルはエキスパート混合構造を採用し、入力内容を処理する最適なエキスパートを自動選択し、性能と品質のバランスを取ります。

モデル能力

テキスト生成
クリエイティブライティング
問題解決
深い推論
ロールプレイ
ストーリー創作
ツール呼び出し

使用事例

クリエイティブライティング
SF小説創作
特定のテーマと感情を含むSF小説の断片を生成します。
生成された内容は感情豊かでテーマが明確で、例にある『最後の伝送』の断片のようになります。
問題解決
深い推論タスク
長い連鎖思考で体系的な推論を行い問題を解決します。
モデルは詳細な思考プロセス(<think>タグで囲まれた)を生成し、最終的な解答を提供できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase