Q

Qwen3 4B FP8

由Qwen開發
Qwen3-4B-FP8是通義千問系列最新的大語言模型,提供40億參數的FP8量化版本,支持思維與非思維模式切換,在推理、指令遵循和智能體能力方面表現卓越。
下載量 23.95k
發布時間 : 4/28/2025

模型概述

基於大規模訓練的因果語言模型,支持複雜邏輯推理、數學計算、編程和多語言任務,具備強大的文本生成和智能體能力。

模型特點

雙模式切換
支持思維模式(複雜推理)與非思維模式(高效對話)無縫切換,通過enable_thinking參數或/think、/no_think指令控制
增強推理能力
在數學、代碼生成和常識邏輯推理方面超越前代模型,特別適合需要逐步推理的任務
FP8量化
提供塊大小128的細粒度FP8量化版本,保持性能同時降低顯存需求
長上下文支持
原生支持32,768 tokens,通過YaRN擴展至131,072 tokens上下文長度
智能體集成
專為工具調用優化,可無縫集成Qwen-Agent框架實現複雜智能體任務

模型能力

複雜邏輯推理
數學計算
代碼生成
多輪對話
多語言翻譯
工具調用
創意寫作
角色扮演

使用案例

教育研究
數學問題求解
分步驟解決數學競賽題並給出詳細推導過程
在GSM8K等數學基準測試中表現優異
編程教學
根據自然語言描述生成可運行代碼並解釋實現邏輯
支持Python等多種編程語言
商業應用
多語言客服
處理100+語言的客戶諮詢並提供本地化響應
減少人工客服工作量
智能助手
集成外部工具完成訂票、查詢等複雜任務
通過Qwen-Agent實現自動化流程
內容創作
創意寫作
生成符合特定風格要求的詩歌、故事等文學作品
輸出自然流暢且富有創意
角色扮演
維持角色一致性進行多輪互動對話
提供沉浸式交互體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase