Qwen3-235B-A22B-GGUF開源大語言模型 - 超長上下文對話和高效架構體驗

首頁

Qwen3 235B A22B GGUF

由lmstudio-community開發

Qwen團隊推出的2350億參數大語言模型量化版本，支持131k上下文長度和混合專家架構

大型語言模型開源協議:Apache-2.0 #超長上下文推理 #混合專家架構 #多語言智能體

下載量 22.88k

發布時間 : 4/28/2025

模型概述

基於Qwen3-235B-A22B的GGUF量化版本，擅長多輪對話、創意寫作和複雜推理任務

模型特點

超長上下文支持

通過YaRN擴展技術支持最長131,072 tokens的上下文處理（默認32k）

雙模式推理

支持通過/no_think指令切換推理/非推理模式，優化不同場景表現

混合專家架構

動態激活22B參數（總235B），在128個專家中智能選擇8個進行推理

多語言能力

支持100+種語言和方言的文本生成與理解

模型能力

創意寫作

角色扮演

多輪對話

指令跟隨

數學推理

編程輔助

常識推理

多語言生成

使用案例

內容創作

創意寫作輔助

生成小說章節、詩歌等創意文本

可產生連貫且富有創意的長文本

角色扮演對話

構建複雜的角色互動場景

支持多輪角色一致性保持

技術應用

代碼生成與解釋

根據自然語言描述生成編程代碼

支持多種編程語言的代碼補全

數學問題求解

解決複雜數學推理問題

顯示分步推理過程

🚀 Qwen3 235B A22B社區模型

該模型入選了 LM Studio 社區模型亮點計劃。此計劃旨在展示社區中新穎且值得關注的模型。快來 Discord 參與討論吧！

本模型由Qwen團隊打造，基於Qwen3-235B-A22B模型進行量化處理，為用戶提供更高效、便捷的文本生成服務。

🚀 快速開始

本模型可在LM Studio中使用，你可以通過LM Studio社區模型亮點計劃快速體驗該模型的強大功能。

✨ 主要特性

長上下文支持：藉助YaRN技術，支持最長達131,072個標記的上下文長度（默認32k）。
推理控制：支持 /no_think 指令，可在提示詞末尾添加該指令以禁用推理功能。
混合專家模型：作為MoE模型，擁有22B激活參數，總共128個專家，其中8個為活躍專家。
雙模式支持：支持思考和非思考兩種模式，在兩種模式下均增強了推理能力，顯著提升了數學、編碼和常識處理能力。
多場景適用：擅長創意寫作、角色扮演、多輪對話和指令遵循。
多語言支持：具備先進的智能體能力，支持超過100種語言和方言。

🔧 技術細節

上下文長度：支持最長達131,072個標記的上下文長度（默認32k），藉助YaRN技術實現。
推理控制：通過在提示詞末尾添加 /no_think 指令，可禁用推理功能。
模型架構：MoE模型，擁有22B激活參數，總共128個專家，其中8個為活躍專家。
模式支持：支持思考和非思考兩種模式，在兩種模式下均增強了推理能力，顯著提升了數學、編碼和常識處理能力。
應用場景：擅長創意寫作、角色扮演、多輪對話和指令遵循。
語言支持：具備先進的智能體能力，支持超過100種語言和方言。

📄 許可證

本模型採用Apache-2.0許可證，詳情請見許可證鏈接。

特別感謝

特別感謝 Georgi Gerganov 以及 llama.cpp 團隊，正是他們的努力才讓這一切成為可能。

免責聲明

LM Studio並非社區模型計劃中任何模型的創建者、發起者或所有者。每個社區模型均由第三方創建和提供。LM Studio不認可、支持、代表或保證任何社區模型的完整性、真實性、準確性或可靠性。你應明白，社區模型生成的內容可能具有冒犯性、有害性、不準確性或其他不當性，或者具有欺騙性。每個社區模型的唯一責任在於發起該模型的個人或實體。LM Studio可能不會監控或控制社區模型，並且不能也不會對任何此類模型負責。LM Studio不承擔關於社區模型的準確性、可靠性或益處的所有保證或擔保。此外，LM Studio不保證社區模型將滿足你的要求，保證其安全性、不間斷性或在任何時間或地點可用，保證無錯誤、無病毒，或保證任何錯誤將得到糾正等。你將獨自承擔因使用或訪問社區模型、下載任何社區模型或使用LM Studio提供或通過LM Studio提供的任何其他社區模型而導致的任何損害的責任。

屬性	詳情
量化者	bartowski
任務類型	文本生成
許可證	Apache-2.0
許可證鏈接	https://huggingface.co/Qwen/Qwen3-235B-A22B/blob/main/LICENSE
基礎模型	Qwen/Qwen3-235B-A22B
基礎模型關係	量化
模型創建者	Qwen
GGUF量化	由 bartowski 基於 `llama.cpp` 版本 b5200 提供