Q

Qwen3 8B 128K GGUF

由unsloth開發
Qwen3是通義千問系列大語言模型的最新8B參數版本,支持思維與非思維模式切換,具備128K上下文長度和卓越的多語言能力。
下載量 15.29k
發布時間 : 4/28/2025

模型概述

Qwen3-8B是通義千問系列的最新語言模型,在推理、指令遵循和代理能力方面有顯著提升,支持100多種語言和方言。

模型特點

雙模式推理
獨特支持思維模式(複雜推理)與非思維模式(高效對話)無縫切換
超長上下文
原生支持32K上下文,通過YaRN技術擴展至128K tokens
多語言能力
支持100多種語言和方言的指令遵循與翻譯
高效微調支持
通過Unsloth優化實現3倍訓練速度提升和70%內存節省

模型能力

複雜邏輯推理
數學問題求解
代碼生成與解釋
多輪對話
多語言翻譯
創意寫作
角色扮演
工具集成

使用案例

教育
數學輔導
幫助學生理解複雜數學概念和解題步驟
通過思維模式提供分步解題指導
開發
代碼輔助
生成、解釋和調試編程代碼
支持多種編程語言的代碼補全
多語言服務
即時翻譯
提供高質量的多語言翻譯服務
支持100+語言間的互譯
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase