Q

Qwen3 32B Quantized.w4a16

RedHatAIによって開発
Qwen3-32BのINT4量子化バージョン、重み量子化によりディスクとGPUメモリ要件を75%削減、高性能を維持
ダウンロード数 2,213
リリース時間 : 5/5/2025

モデル概要

Qwen3-32Bベースの量子化モデル、テキスト生成、関数呼び出し、多言語タスクに適し、効率的な推論をサポート

モデル特徴

効率的な量子化
INT4重み量子化を採用、ディスクとGPUメモリ要件を75%削減
高性能維持
量子化後モデルは複数のベンチマークテストで99%以上の元の性能を維持
多言語サポート
複数言語の命令追従と翻訳タスクをサポート
効率的な推論
最適化後、vLLMなどの効率的な推論フレームワーク上での展開に適している

モデル能力

テキスト生成
関数呼び出し
多言語命令追従
翻訳
ドメインファインチューニング

使用事例

汎用推論
知識質問応答
様々な知識問題に回答
MMLUテストで80.36点を達成
数学的推論
数学問題を解決
GSM-8Kテストで85.97点を達成
専門的応用
ドメインエキスパート
ファインチューニングにより特定分野の専門家になる
コード生成
プログラミングコードを生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase