Q

Qwen3 30B A3B GGUF

由Mungert開發
Qwen3-30B-A3B是基於Qwen3-30B-A3B-Base的大語言模型,支持文本生成任務,採用超低位量化技術優化內存效率。
下載量 2,135
發布時間 : 5/13/2025

模型概述

Qwen3-30B-A3B是一個30B參數規模的大語言模型,支持文本生成任務。該模型通過GGUF格式和IQ-DynamicGate超低位量化技術,在保持較高精度的同時顯著降低內存佔用,適用於多種硬件環境。

模型特點

IQ-DynamicGate超低位量化
採用1-2比特超低位量化技術,通過動態精度分配和關鍵組件保護,在保持極致內存效率的同時顯著提升精度。
多格式支持
提供BF16、F16及多種量化格式(如Q4_K、Q6_K、Q8_0等),適應不同硬件和內存需求。
硬件適配優化
針對CPU、GPU及邊緣設備進行優化,支持BF16/FP16加速和ARM設備專用量化。

模型能力

文本生成
低內存推理
多硬件支持

使用案例

自然語言處理
文本生成
生成連貫、上下文相關的文本內容。
高質量文本輸出,適用於內容創作、對話系統等。
邊緣計算
低內存設備部署
在內存受限的設備(如邊緣設備)上運行大型語言模型。
通過超低位量化實現高效推理,內存佔用顯著降低。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase