Q

Qwen3 8B AWQ

由Qwen開發
Qwen3-8B-AWQ是通義千問系列最新一代8.2B參數的大語言模型,採用AWQ 4-bit量化技術優化推理效率。支持思維與非思維模式切換,具備卓越的推理、指令遵循和智能體能力。
下載量 13.99k
發布時間 : 5/3/2025

模型概述

基於Qwen3-8B的4-bit量化版本,在保持模型性能的同時顯著降低計算資源需求。支持32K上下文長度,可通過YaRN擴展至131K tokens。

模型特點

雙模式動態切換
支持思維模式(複雜推理)與非思維模式(高效對話)無縫切換,通過enable_thinking參數或/think、/no_think指令控制
增強推理能力
在數學、代碼生成和邏輯推理方面超越前代模型,思維模式下使用特殊解碼策略提升性能
高效量化
採用AWQ 4-bit量化技術,在保持模型精度的同時減少75%顯存佔用
超長上下文
原生支持32K tokens,通過YaRN技術可擴展至131K tokens長文本處理

模型能力

複雜邏輯推理
多輪對話
代碼生成
多語言翻譯
工具調用
創意寫作
數學計算

使用案例

智能助手
個性化對話
通過思維模式實現深度推理對話,或非思維模式進行高效日常交流
更自然的交互體驗,響應速度提升40%
開發輔助
代碼補全
利用增強的代碼理解能力生成高質量代碼片段
在HumanEval基準測試中達到開源模型領先水平
數據分析
長文檔處理
結合YaRN技術分析超長技術文檔或法律文本
支持131K tokens上下文理解
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase