开源Qwen3-8B-Esper3代码专家模型 - 本地与服务器推理免费可用

首页

Qwen3 8B Esper3

由 ValiantLabs 开发

埃斯佩尔3是基于千问3构建的代码、架构和开发运维推理专家模型，适用于本地和服务器推理。

大型语言模型

Transformers

支持多种语言开源协议:Apache-2.0 #代码推理专家 #云架构设计 #多语言编程支持

下载量 83

发布时间 : 5/5/2025

模型简介

埃斯佩尔3是基于千问3构建的代码、架构和开发运维推理专家模型，通过微调开发运维和架构推理数据增强其问题解决能力。

模型特点

代码与开发运维推理

专注于代码生成、架构设计和开发运维任务，支持多种编程语言和云平台。

通用推理增强

通过微调通用和创意推理数据，提升问题解决和一般聊天表现。

高效推理

小模型尺寸允许在本地桌面和移动设备上运行，以及超快的服务器推理。

模型能力

文本生成

代码生成

架构设计

开发运维任务

问题解决

一般聊天

使用案例

开发运维

Terraform配置生成

生成使用aws_ami数据源查找最新Amazon Linux 2 AMI的Terraform配置。

动态确定AMI ID并配置EC2实例。

代码生成

Python脚本编写

生成Python脚本以自动化常见开发任务。

高效完成代码编写任务。

🚀 Esper 3：基于Qwen 3的编码与推理专家模型

Esper 3是基于Qwen 3构建的模型，在编码、架构设计和DevOps推理方面表现出色。它经过精心微调，能有效解决各类问题，无论是在本地桌面、移动设备，还是服务器上，都能提供出色的性能。

🚀 快速开始

支持开源项目：支持我们的开源数据集和模型发布！
模型版本：Esper 3有不同的版本可供选择，包括 [Qwen3 - 4B](https://huggingface.co/ValiantLabs/Qwen3 - 4B - Esper3)、[Qwen3 - 8B](https://huggingface.co/ValiantLabs/Qwen3 - 8B - Esper3) 和 [Qwen3 - 14B](https://huggingface.co/ValiantLabs/Qwen3 - 14B - Esper3)。

✨ 主要特性

精细微调：在使用Deepseek R1生成的 [DevOps和架构推理](https://huggingface.co/datasets/sequelbox/Titanium2.1 - DeepSeek - R1) 以及 [代码推理](https://huggingface.co/datasets/sequelbox/Tachibana2 - DeepSeek - R1) 数据上进行了微调。
推理能力提升：改进了 [通用和创造性推理](https://huggingface.co/datasets/sequelbox/Raiden - DeepSeek - R1) 能力，增强了解决问题和日常对话的性能。
灵活部署：模型规模较小，支持在本地桌面和移动设备上运行，同时在服务器上推理速度极快。

📦 安装指南

文档未提及具体安装步骤，故跳过此章节。

💻 使用示例

基础用法

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "ValiantLabs/Qwen3-8B-Esper3"

# load the tokenizer and the model
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)

# prepare the model input
prompt = "Write a Terraform configuration that uses the `aws_ami` data source to find the latest Amazon Linux 2 AMI. Then, provision an EC2 instance using this dynamically determined AMI ID."
messages = [
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
    enable_thinking=True # Switches between thinking and non-thinking modes. Default is True.
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

# conduct text completion
generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=32768
)
output_ids = generated_ids[0][len(model_inputs.input_ids[0]):].tolist() 

# parsing thinking content
try:
    # rindex finding 151668 (</think>)
    index = len(output_ids) - output_ids[::-1].index(151668)
except ValueError:
    index = 0

thinking_content = tokenizer.decode(output_ids[:index], skip_special_tokens=True).strip("\n")
content = tokenizer.decode(output_ids[index:], skip_special_tokens=True).strip("\n")

print("thinking content:", thinking_content)
print("content:", content)

📚 详细文档

Esper 3使用 [Qwen 3](https://huggingface.co/Qwen/Qwen3 - 8B) 的提示格式。作为推理微调模型，建议在所有对话中启用 enable_thinking = True。

🔧 技术细节

文档未提供具体技术实现细节，故跳过此章节。

📄 许可证

本项目采用 apache - 2.0 许可证。

其他信息

数据集：模型基于以下数据集进行训练：
- [sequelbox/Titanium2.1 - DeepSeek - R1](https://huggingface.co/datasets/sequelbox/Titanium2.1 - DeepSeek - R1)
- [sequelbox/Tachibana2 - DeepSeek - R1](https://huggingface.co/datasets/sequelbox/Tachibana2 - DeepSeek - R1)
- [sequelbox/Raiden - DeepSeek - R1](https://huggingface.co/datasets/sequelbox/Raiden - DeepSeek - R1)
模型创建者：Esper 3由 Valiant Labs 创建。
更多模型：查看我们的HuggingFace页面，了解所有模型！

![image/jpeg](https://cdn - uploads.huggingface.co/production/uploads/64f267a8a4f79a118e0fcc89/qdicXwrO_XOKRTjOu2yBF.jpeg) ![image/jpeg](https://cdn - uploads.huggingface.co/production/uploads/63444f2687964b331809eb55/VCJ8Fmefd8cdVhXSSxJiD.jpeg)