Q

Qwen3 4B FP8

由 Qwen 开发
Qwen3-4B-FP8是通义千问系列最新的大语言模型,提供40亿参数的FP8量化版本,支持思维与非思维模式切换,在推理、指令遵循和智能体能力方面表现卓越。
下载量 23.95k
发布时间 : 4/28/2025

模型简介

基于大规模训练的因果语言模型,支持复杂逻辑推理、数学计算、编程和多语言任务,具备强大的文本生成和智能体能力。

模型特点

双模式切换
支持思维模式(复杂推理)与非思维模式(高效对话)无缝切换,通过enable_thinking参数或/think、/no_think指令控制
增强推理能力
在数学、代码生成和常识逻辑推理方面超越前代模型,特别适合需要逐步推理的任务
FP8量化
提供块大小128的细粒度FP8量化版本,保持性能同时降低显存需求
长上下文支持
原生支持32,768 tokens,通过YaRN扩展至131,072 tokens上下文长度
智能体集成
专为工具调用优化,可无缝集成Qwen-Agent框架实现复杂智能体任务

模型能力

复杂逻辑推理
数学计算
代码生成
多轮对话
多语言翻译
工具调用
创意写作
角色扮演

使用案例

教育研究
数学问题求解
分步骤解决数学竞赛题并给出详细推导过程
在GSM8K等数学基准测试中表现优异
编程教学
根据自然语言描述生成可运行代码并解释实现逻辑
支持Python等多种编程语言
商业应用
多语言客服
处理100+语言的客户咨询并提供本地化响应
减少人工客服工作量
智能助手
集成外部工具完成订票、查询等复杂任务
通过Qwen-Agent实现自动化流程
内容创作
创意写作
生成符合特定风格要求的诗歌、故事等文学作品
输出自然流畅且富有创意
角色扮演
维持角色一致性进行多轮互动对话
提供沉浸式交互体验
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase