Q

Qwen3 30B A1.5B High Speed

由DavidAU開發
Qwen3-30B的高速優化版本,通過減少激活專家數量實現推理速度翻倍,適用於需要快速響應的文本生成場景
下載量 179
發布時間 : 5/3/2025

模型概述

基於Qwen3-30B-A3B混合專家模型微調,將激活專家數量從8個減少到4個,顯著提升推理速度同時保持模型能力

模型特點

高速推理
通過減少激活專家數量至4個(總128個),推理速度提升近一倍
32K長上下文
支持32K上下文長度+8K輸出,總計40K處理能力
多量化格式支持
支持GGUF、GPTQ、EXL2、AWQ、HQQ等多種量化格式
高效資源利用
僅激活1.5B參數(總30B),在CPU/GPU上均有優異表現

模型能力

長文本生成
複雜推理
多輪對話
代碼生成
創意寫作

使用案例

內容創作
科幻小說創作
生成具有情感深度的科幻短篇故事
示例中展示了800-1000字的完整科幻故事創作
對話系統
深度思考對話
通過<think>標籤展示AI的推理過程
模型能夠展示詳細的思考鏈和內心獨白
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase