Qwen3-4B-GGUF開源大語言模型 - 長上下文支持創意寫作與多輪對話

首頁

Qwen3 4B GGUF

由lmstudio-community開發

Qwen3-4B是由Qwen開發的大語言模型，支持131,072 tokens的上下文長度，擅長創意寫作、角色扮演和多輪對話。

大型語言模型 #超長上下文 #多語言智能體 #指令雙模式

下載量 26.16k

發布時間 : 4/28/2025

模型概述

Qwen3-4B是一個高性能的大語言模型，具備高級智能體能力，支持100+種語言與方言，擅長創意寫作、角色扮演、多輪對話及指令跟隨。

模型特點

長上下文支持

支持最長131,072 tokens的上下文（YaRN默認32k）。

雙模式支持

支持思考/非思考雙模式，增強數學、編程與常識推理能力。

高級智能體能力

具備高級智能體能力，支持100+種語言與方言。

禁用推理指令

支持`/no_think`指令禁用推理（只需在提示詞末尾添加）。

模型能力

創意寫作

角色扮演

多輪對話

指令跟隨

數學推理

編程推理

常識推理

使用案例

創意寫作

故事生成

生成連貫且富有創意的故事內容。

角色扮演

虛擬角色對話

模擬不同角色的對話行為。

編程輔助

代碼生成

根據需求生成代碼片段。

🚀 社區模型：Qwen出品的Qwen3 4B

這是 LM Studio 社區模型亮點計劃。該計劃旨在突出社區中的新模型和值得關注的模型。快來 Discord 參與討論吧！

🚀 快速開始

本模型是Qwen3 4B的量化版本，由bartowski基於llama.cpp的b5200版本進行量化。以下是模型的相關信息：

屬性	詳情
量化者	bartowski
模型類型	文本生成
基礎模型	Qwen/Qwen3-4B
基礎模型關係	量化版本

✨ 主要特性

模型創建者：Qwen
原始模型：Qwen3-4B
GGUF量化：由 bartowski 基於 llama.cpp 的 b5200 版本提供

🔧 技術細節

上下文長度：使用YaRN技術時，支持最長達131,072個標記的上下文長度（默認32k）。
禁用推理：支持 /no_think 指令，只需將其添加到提示詞末尾，即可禁用推理功能。
雙模式支持：支持思考和非思考兩種模式，且在兩種模式下均增強了推理能力，顯著提升了數學、編碼和常識推理的表現。
多場景擅長：在創意寫作、角色扮演、多輪對話和指令遵循方面表現出色。
多語言支持：具備高級智能體能力，支持超過100種語言和方言。

🌟 特別感謝

特別感謝 Georgi Gerganov 以及整個 llama.cpp 團隊，是他們讓這一切成為可能。

⚠️ 免責聲明

LM Studio並非社區模型計劃中任何模型的創建者、發起者或所有者。每個社區模型均由第三方創建和提供。LM Studio不認可、支持、代表或保證任何社區模型的完整性、真實性、準確性或可靠性。您應明白，社區模型生成的內容可能具有冒犯性、有害性、不準確性或其他不當性，甚至具有欺騙性。每個社區模型的唯一責任由發起該模型的個人或實體承擔。LM Studio可能不會監控或控制社區模型，也不能且不會對任何此類模型負責。LM Studio對社區模型的準確性、可靠性或益處不做任何保證。此外，LM Studio不保證社區模型能滿足您的需求，也不保證其安全性、連續性、隨時可用性，或無錯誤、無病毒，也不保證會糾正任何錯誤等。您將獨自承擔因使用或訪問社區模型、下載任何社區模型或使用LM Studio提供或通過LM Studio提供的任何其他社區模型而導致的任何損失。