Q

Qwen3 30B A3B Quantized.w4a16

由RedHatAI開發
Qwen3-30B-A3B的INT4量化版本,通過權重量化減少75%的磁盤和GPU內存需求,保持高性能。
下載量 379
發布時間 : 5/6/2025

模型概述

基於Qwen3-30B-A3B的量化模型,適用於推理、函數調用、多語言指令遵循和翻譯任務。

模型特點

高效權重量化
採用INT4量化方案,減少75%的磁盤和GPU內存需求。
高性能推理
在多個基準測試中保持接近原始模型的性能,恢復率達98%以上。
多語言支持
支持多語言指令遵循和翻譯任務。
優化部署
支持vLLM後端高效部署,兼容OpenAI服務。

模型能力

文本生成
函數調用
多語言指令遵循
翻譯

使用案例

自然語言處理
多語言翻譯
支持多種語言之間的高質量翻譯。
指令遵循
能夠理解和執行復雜的多語言指令。
推理任務
數學推理
在數學推理任務中表現優異。
GSM-8K任務中達到86.66分
邏輯推理
在邏輯推理任務中保持高性能。
ARC Challenge任務中達到62.97分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase