Q

Qwen3 30B A1.5B High Speed GGUF

Mungertによって開発
Qwen 30B - A3B(MOE)をベースに微調整された高効率推論モデルで、専家の数を減らすことでほぼ2倍の速度向上を実現し、複数の量子化形式と40Kのコンテキスト長をサポートします。
ダウンロード数 732
リリース時間 : 6/5/2025

モデル概要

高効率推論に最適化された混合専家モデルで、CPU/GPUデプロイをサポートし、テキスト生成、深度思考などのタスクに適しており、特にリソースが制限された環境に適しています。

モデル特徴

高速推論
アクティブな専家の数を4つに減らすことで、ほぼ2倍の推論速度を実現します。
多形式サポート
GGUF、GPTQ、EXL2などの複数の量子化形式をサポートし、異なるハードウェアに適合します。
大規模コンテキストウィンドウ
40Kトークンのコンテキスト長をサポートします(入力32K + 出力8K)。
深度思考モード
システムロールの設定により、チェーン式の深度推論を実現し、<think>タグ付きの思考過程を出力します。
低リソースデプロイ
量子化バージョンはCPUまたは低VRAMのGPUで実行でき、メモリ使用量を最小限に抑えます。

モデル能力

長文テキスト生成
体系的推論
ネットワーク監視分析
セキュリティ監査支援
多輪対話
技術文書処理

使用事例

ネットワーク監視とセキュリティ
SSL証明書チェック
ウェブサイトのSSL証明書の安全性を分析します。
証明書の有効性レポートを自動生成します。
量子セキュリティ暗号化検出
サーバーが量子セキュリティ暗号化通信を使用しているかどうかをチェックします。
暗号化プロトコルの種類を識別し、改善提案を行います。
自動化セキュリティ監査
包括的なサーバーセキュリティ監査を実行します。
脆弱性分析を含むセキュリティレポートを生成します。
創造的コンテンツ生成
SFストーリー作成
指定されたテーマに基づいて800 - 1000字のSF小説を生成します。
完全な情節と感情的な深みを含むストーリーを出力します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase