Q

Qwen3 30B A3B Quantized.w4a16

Developed by RedHatAI
Qwen3-30B-A3BのINT4量子化バージョン、重み量子化によりディスクとGPUメモリ要件を75%削減し、高性能を維持。
Downloads 379
Release Time : 5/6/2025

Model Overview

Qwen3-30B-A3Bベースの量子化モデル、推論、関数呼び出し、多言語命令追従および翻訳タスクに適しています。

Model Features

効率的な重み量子化
INT4量子化スキームを採用し、ディスクとGPUメモリ要件を75%削減。
高性能推論
複数のベンチマークテストでオリジナルモデルに近い性能を維持、回復率98%以上。
多言語サポート
多言語命令追従および翻訳タスクをサポート。
最適化されたデプロイ
vLLMバックエンドによる効率的なデプロイをサポート、OpenAIサービスと互換性あり。

Model Capabilities

テキスト生成
関数呼び出し
多言語命令追従
翻訳

Use Cases

自然言語処理
多言語翻訳
複数言語間の高品質な翻訳をサポート。
命令追従
複雑な多言語命令を理解し実行可能。
推論タスク
数学推論
数学推論タスクで優れた性能を発揮。
GSM-8Kタスクで86.66点を達成
論理推論
論理推論タスクで高性能を維持。
ARC Challengeタスクで62.97点を達成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase