Q

Qwen3 30B A3B GGUF

ubergarmによって開発
Qwen3-30B-A3Bの量子化バージョンで、先進的な非線形SotA量子化技術を採用し、与えられたメモリ使用量で同類最高の品質を提供します。
ダウンロード数 780
リリース時間 : 5/2/2025

モデル概要

これはQwen/Qwen3-30B-A3Bモデルに基づく量子化バージョンで、効率的な推論のために設計されており、対話型インタラクションをサポートし、テキスト生成タスクに適しています。

モデル特徴

先進的な非線形量子化
ik_llama.cppブランチを使用して先進的な非線形SotA量子化をサポートし、高品質な推論を提供します。
効率的なメモリ使用量
24GB VRAMのGPUで32k以上のコンテキストを実行可能で、メモリ使用を最適化しています。
高性能推論
3090TI FE 24GB VRAMで1600 tok/sec以上のPPと105 tok/secのTGを達成します。

モデル能力

テキスト生成
対話型インタラクション
長いコンテキスト処理

使用事例

テキスト生成
対話システム
効率的な対話システムの構築に使用され、長いコンテキストインタラクションをサポートします。
32kコンテキストで高品質な生成を維持
コンテンツ作成
記事やストーリーなどの高品質なテキストコンテンツの生成を支援します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase