Qwen3-4B-Esper3开源编码模型 - 支持本地与服务器部署开发运维必备

Home

Qwen3 4B Esper3

Developed by ValiantLabs

埃斯珀 3 是基于千问 3 构建的编码、架构和开发运维推理专家模型，适用于本地和服务器部署。

大型语言模型

Transformers

Supports Multiple LanguagesOpen Source License:Apache-2.0 #开发运维推理 #代码生成专家 #云架构设计

Downloads 4,951

Release Time : 5/6/2025

Model Overview

埃斯珀 3 是一个专注于代码生成、架构设计和开发运维任务的推理专家模型，基于 Qwen3-4B 微调而成，支持快速推理和问题解决。

Model Features

开发运维和架构推理

微调使用了开发运维和架构推理数据，擅长解决相关领域问题

代码推理能力

通过代码推理数据增强，能够处理多种编程语言的代码生成任务

通用和创意推理

改进的通用推理能力增强了问题解决和一般聊天性能

高效推理

小模型尺寸允许在本地桌面和移动设备上运行，支持超快速的服务器推理

Model Capabilities

文本生成

代码生成

架构设计

开发运维自动化

问题解决

创意推理

Use Cases

云计算基础设施

Terraform 配置生成

自动生成 AWS 基础设施的 Terraform 配置代码

可动态确定 AMI ID 并配置 EC2 实例

软件开发

代码辅助

帮助开发者编写 Python、JavaScript 等语言的代码

提高开发效率，减少重复工作

系统架构

架构设计咨询

提供云计算架构设计建议

帮助优化云资源使用和系统架构

🚀 埃斯珀3（Esper 3）模型

埃斯珀3（Esper 3）是基于通义千问3（Qwen 3）构建的编码、架构和DevOps推理专家模型。它在特定数据集上进行了微调，具备出色的编码、推理和解决问题的能力，且小模型尺寸允许在本地桌面和移动设备上运行，同时支持超快速的服务器推理。

🚀 快速开始

模型信息

属性	详情
库名称	transformers
任务类型	文本生成
基础模型	Qwen/Qwen3 - 4B
模型类型	Esper 3：[Qwen3 - 4B](https://huggingface.co/ValiantLabs/Qwen3 - 4B - Esper3)，[Qwen3 - 8B](https://huggingface.co/ValiantLabs/Qwen3 - 8B - Esper3)，[Qwen3 - 14B](https://huggingface.co/ValiantLabs/Qwen3 - 14B - Esper3)
训练数据	[sequelbox/Titanium2.1 - DeepSeek - R1](https://huggingface.co/datasets/sequelbox/Titanium2.1 - DeepSeek - R1)，[sequelbox/Tachibana2 - DeepSeek - R1](https://huggingface.co/datasets/sequelbox/Tachibana2 - DeepSeek - R1)，[sequelbox/Raiden - DeepSeek - R1](https://huggingface.co/datasets/sequelbox/Raiden - DeepSeek - R1)
许可证	apache - 2.0

支持开源

支持我们的开源数据集和模型发布！

![图片](https://cdn - uploads.huggingface.co/production/uploads/64f267a8a4f79a118e0fcc89/qdicXwrO_XOKRTjOu2yBF.jpeg)

✨ 主要特性

专业微调：在我们使用Deepseek R1生成的[DevOps和架构推理](https://huggingface.co/datasets/sequelbox/Titanium2.1 - DeepSeek - R1)以及[代码推理](https://huggingface.co/datasets/sequelbox/Tachibana2 - DeepSeek - R1)数据上进行了微调。
推理能力提升：改进了[通用和创造性推理](https://huggingface.co/datasets/sequelbox/Raiden - DeepSeek - R1)，以补充解决问题和通用聊天性能。
轻量级运行：小模型尺寸允许在本地桌面和移动设备上运行，同时支持超快速的服务器推理。

💻 使用示例

基础用法

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "ValiantLabs/Qwen3-4B-Esper3"

# 加载分词器和模型
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)

# 准备模型输入
prompt = "Write a Terraform configuration that uses the `aws_ami` data source to find the latest Amazon Linux 2 AMI. Then, provision an EC2 instance using this dynamically determined AMI ID."
messages = [
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
    enable_thinking=True # 在思考和非思考模式之间切换。默认值为True。
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

# 进行文本生成
generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=32768
)
output_ids = generated_ids[0][len(model_inputs.input_ids[0]):].tolist() 

# 解析思考内容
try:
    # rindex查找151668 (</think>)
    index = len(output_ids) - output_ids[::-1].index(151668)
except ValueError:
    index = 0

thinking_content = tokenizer.decode(output_ids[:index], skip_special_tokens=True).strip("\n")
content = tokenizer.decode(output_ids[index:], skip_special_tokens=True).strip("\n")

print("thinking content:", thinking_content)
print("content:", content)