Q

Qwen3 235B A22B

由 unsloth 开发
Qwen3 是 Qwen 系列最新一代的大语言模型,提供了一系列密集和混合专家(MoE)模型。基于广泛的训练,Qwen3 在推理、指令遵循、代理能力和多语言支持方面取得了突破性进展。
下载量 421
发布时间 : 5/9/2025

模型简介

Qwen3-235B-A22B 是一个具有 235B 参数和 22B 激活参数的混合专家(MoE)模型,支持 100 多种语言,具备强大的推理、指令遵循和代理能力。

模型特点

思维与非思维模式切换
支持在单个模型内无缝切换思维模式(用于复杂的逻辑推理、数学和编码)和非思维模式(用于高效的通用对话)。
增强的推理能力
在数学、代码生成和常识逻辑推理方面超越了之前的 QwQ 和 Qwen2.5 指令模型。
卓越的人类偏好对齐
在创意写作、角色扮演、多轮对话和指令遵循方面表现出色,提供更自然、引人入胜和沉浸式的对话体验。
专业的代理能力
能够在思维和非思维模式下精确集成外部工具,并在复杂的基于代理的任务中实现领先性能。
多语言支持
支持 100 多种语言和方言,具备强大的多语言指令遵循和翻译能力。

模型能力

文本生成
逻辑推理
数学计算
代码生成
多语言翻译
工具调用
多轮对话

使用案例

教育
数学问题解答
帮助学生解决复杂的数学问题,提供逐步推理过程。
提高学生的数学理解和解题能力。
编程
代码生成
根据用户需求生成高质量的代码片段或完整程序。
提高开发效率,减少编码错误。
客户服务
多语言客服
提供多语言的客户支持,理解并回答客户问题。
提升客户满意度,降低语言障碍。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase