Qwen3-30B-A3B-GGUF開源大語言模型 - 長文本支持創意寫作與多輪對話

首頁

Qwen3 30B A3B GGUF

由lmstudio-community開發

由Qwen開發的大語言模型，支持131,072 tokens上下文長度，擅長創意寫作、角色扮演和多輪對話。

大型語言模型開源協議:Apache-2.0 #超長上下文推理 #混合專家架構 #多模態智能體

下載量 77.06k

發布時間 : 4/28/2025

模型概述

Qwen3-30B-A3B是一個基於混合專家架構的大語言模型，具備強大的文本生成和推理能力，支持多種語言和方言。

模型特點

超長上下文支持

支持最長131,072 tokens的上下文（使用YaRN技術，默認32k）

雙模式推理

具備思維/非思維雙模式，顯著增強數學、編程與常識推理能力

混合專家架構

採用128個專家層的混合專家架構，激活參數量3.3B

多語言支持

支持100+種語言與方言，具備高級智能體能力

模型能力

文本生成

創意寫作

角色扮演

多輪對話

指令跟隨

數學推理

編程輔助

常識推理

使用案例

創意寫作

小說創作

生成連貫的長篇故事或小說章節

可生成具有邏輯性和創造性的文本

對話系統

智能客服

用於多輪對話場景的智能客服系統

能夠理解複雜問題並提供準確回答

教育輔助

數學解題

幫助學生解決數學問題並解釋解題步驟

提供詳細的推理過程和正確答案

🚀 社區模型：Qwen出品的Qwen3 30B A3B

這是 LM Studio 社區模型亮點計劃。該計劃旨在突出社區中的新穎且值得關注的模型。快來 Discord 參與討論吧！

屬性	詳情
量化者	bartowski
任務類型	文本生成
許可證	apache-2.0
基礎模型	Qwen/Qwen3-30B-A3B
基礎模型關係	量化版本

模型創建者：Qwen 原始模型：Qwen3-30B-A3B GGUF 量化：由 bartowski 基於 llama.cpp 版本 b5200 提供

🔧 技術細節

藉助 YaRN 技術，支持最長達 131,072 個標記的上下文長度（默認 32k）。
支持 /no_think 指令來禁用推理功能，只需將其添加到提示詞末尾即可。
該模型為 MoE 模型，激活權重為 33 億，共有 128 個專家，其中 8 個為激活專家。
支持思考和非思考兩種模式，且在兩種模式下均增強了推理能力，顯著提升了數學、編碼和常識處理能力。
在創意寫作、角色扮演、多輪對話和指令遵循方面表現出色。
具備高級智能體能力，支持超過 100 種語言和方言。

特別感謝

特別感謝 Georgi Gerganov 以及整個 llama.cpp 團隊，是他們讓這一切成為可能。

免責聲明

LM Studio 並非社區模型計劃中任何模型的創建者、發起者或所有者。每個社區模型均由第三方創建和提供。LM Studio 不認可、支持、代表或保證任何社區模型的完整性、真實性、準確性或可靠性。您應明白，社區模型生成的內容可能具有冒犯性、有害性、不準確性或其他不當性，甚至具有欺騙性。每個社區模型的唯一責任方是發起該模型的個人或實體。LM Studio 可能不會監控或控制社區模型，並且不能也不會對任何此類模型負責。LM Studio 對社區模型的準確性、可靠性或益處不做任何保證。此外，LM Studio 不保證社區模型能滿足您的需求，也不保證其安全性、連續性、隨時可用性、無錯誤、無病毒，或保證任何錯誤會得到糾正等。您將獨自承擔因使用或訪問社區模型、下載任何社區模型或使用 LM Studio 提供或通過其提供的任何其他社區模型而導致的任何損失。