Q

Qwen3 32B Quantized.w4a16

由RedHatAI開發
Qwen3-32B的INT4量化版本,通過權重量化減少75%的磁盤和GPU內存需求,保持高性能
下載量 2,213
發布時間 : 5/5/2025

模型概述

基於Qwen3-32B的量化模型,適用於文本生成、函數調用和多語言任務,支持高效推理

模型特點

高效量化
採用INT4權重量化,減少75%的磁盤和GPU內存需求
高性能保持
量化後模型在多個基準測試中保持99%以上的原始性能
多語言支持
支持多種語言的指令跟隨和翻譯任務
高效推理
優化後適合在vLLM等高效推理框架上部署

模型能力

文本生成
函數調用
多語言指令跟隨
翻譯
領域微調

使用案例

通用推理
知識問答
回答各類知識性問題
在MMLU測試中達到80.36分
數學推理
解決數學問題
在GSM-8K測試中達到85.97分
專業應用
領域專家
通過微調成為特定領域專家
代碼生成
生成編程代碼
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase