Qwen3-8B-GGUF開源大語言模型 - 支持超長上下文與多語言處理

首頁

Qwen3 8B GGUF

由lmstudio-community開發

Qwen團隊推出的8B參數規模大語言模型，支持超長上下文和多種語言處理

大型語言模型開源協議:Apache-2.0 #超長上下文推理 #多模態指令跟隨 #數學編程增強

下載量 39.45k

發布時間 : 4/28/2025

模型概述

基於Qwen3架構的8B參數規模大語言模型，擅長創意寫作、角色扮演和多輪對話，具備高級智能體能力和多語言支持

模型特點

超長上下文支持

支持最長131,072 tokens的上下文處理（默認32k），採用YaRN技術

雙模式推理

兼具思維鏈推理與直出模式，可通過/no_think指令切換

多領域增強

數學、編程與常識推理能力經過特別優化

多語言支持

支持超過100種語言與方言處理

模型能力

文本生成

創意寫作

角色扮演

多輪對話

指令跟隨

數學推理

編程輔助

常識推理

使用案例

內容創作

創意寫作

生成小說、詩歌等創意文本

可產生富有想象力的文學內容

角色扮演

模擬不同角色的對話交互

能維持連貫的角色設定和對話

技術應用

編程輔助

代碼生成與解釋

支持多種編程語言的代碼處理

數學推理

解決數學問題和邏輯推理

能處理複雜數學計算和證明

🚀 Qwen3 8B量化模型

該模型是LM Studio社區模型亮點計劃的一部分，旨在展示社區中新穎且值得關注的模型。快來Discord參與討論吧！

模型信息

屬性	詳情
量化者	bartowski
任務類型	文本生成
許可證	apache - 2.0
基礎模型	Qwen/Qwen3 - 8B
基礎模型關係	量化版本

模型創建者

Qwen

原始模型

Qwen3 - 8B

GGUF量化

由bartowski基於llama.cpp的b5200版本提供。

🔧 技術細節

上下文長度：藉助YaRN技術，支持最長達131,072個標記的上下文長度（默認32k）。
禁用推理：支持使用/no_think來禁用推理功能，只需將其添加到提示詞末尾即可。
推理模式：支持思考和非思考兩種模式，且在兩種模式下都增強了推理能力，在數學、編碼和常識推理方面表現顯著提升。
應用場景：在創意寫作、角色扮演、多輪對話和指令遵循等方面表現出色。
語言支持：具備先進的智能體能力，支持超過100種語言和方言。

👏 特別感謝

特別感謝Georgi Gerganov以及llama.cpp的整個開發團隊，是他們讓這一切成為可能。

⚠️ 免責聲明

LM Studio並非社區模型計劃中任何模型的創建者、發起者或所有者。每個社區模型均由第三方創建和提供。LM Studio不認可、支持、代表或保證任何社區模型的完整性、真實性、準確性或可靠性。您需明白，社區模型生成的內容可能具有冒犯性、有害性、不準確性或其他不當性，甚至具有欺騙性。每個社區模型的唯一責任在於發起該模型的個人或實體。LM Studio可能不會監控或控制社區模型，也不能且不會對任何此類模型負責。LM Studio對社區模型的準確性、可靠性或益處不做任何保證。此外，LM Studio不保證社區模型能滿足您的需求，也不保證其安全性、連續性、隨時可用性、無錯誤、無病毒，或能修復任何錯誤等。您需獨自承擔因使用或訪問社區模型、下載任何社區模型，或使用LM Studio提供或通過其提供的任何其他社區模型而導致的任何損失。