Q

Qwen3 30B A3B GGUF

由ubergarm開發
Qwen3-30B-A3B的量化版本,採用先進的非線性SotA量化技術,在給定內存佔用下提供同類最佳的質量。
下載量 780
發布時間 : 5/2/2025

模型概述

這是一個基於Qwen/Qwen3-30B-A3B模型的量化版本,專為高效推理設計,支持對話式交互,適用於文本生成任務。

模型特點

先進的非線性量化
使用ik_llama.cpp分支支持先進的非線性SotA量化,提供高質量推理。
高效內存佔用
在24GB VRAM的GPU上可運行超過32k上下文,優化內存使用。
高性能推理
在3090TI FE 24GB VRAM上達到超過1600 tok/sec的PP和105 tok/sec的TG。

模型能力

文本生成
對話式交互
長上下文處理

使用案例

文本生成
對話系統
用於構建高效的對話系統,支持長上下文交互。
在32k上下文下保持高質量生成
內容創作
輔助生成高質量文本內容,如文章、故事等。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase