Qwen3-4B-Esper3開源編碼模型 - 支持本地與服務器部署開發運維必備

首頁

Qwen3 4B Esper3

由ValiantLabs開發

埃斯珀 3 是基於千問 3 構建的編碼、架構和開發運維推理專家模型，適用於本地和服務器部署。

大型語言模型

Transformers

支持多種語言開源協議:Apache-2.0 #開發運維推理 #代碼生成專家 #雲架構設計

下載量 4,951

發布時間 : 5/6/2025

模型概述

埃斯珀 3 是一個專注於代碼生成、架構設計和開發運維任務的推理專家模型，基於 Qwen3-4B 微調而成，支持快速推理和問題解決。

模型特點

開發運維和架構推理

微調使用了開發運維和架構推理數據，擅長解決相關領域問題

代碼推理能力

通過代碼推理數據增強，能夠處理多種編程語言的代碼生成任務

通用和創意推理

改進的通用推理能力增強了問題解決和一般聊天性能

高效推理

小模型尺寸允許在本地桌面和移動設備上運行，支持超快速的服務器推理

模型能力

文本生成

代碼生成

架構設計

開發運維自動化

問題解決

創意推理

使用案例

雲計算基礎設施

Terraform 配置生成

自動生成 AWS 基礎設施的 Terraform 配置代碼

可動態確定 AMI ID 並配置 EC2 實例

軟件開發

代碼輔助

幫助開發者編寫 Python、JavaScript 等語言的代碼

提高開發效率，減少重複工作

系統架構

架構設計諮詢

提供雲計算架構設計建議

幫助優化雲資源使用和系統架構

🚀 埃斯珀3（Esper 3）模型

埃斯珀3（Esper 3）是基於通義千問3（Qwen 3）構建的編碼、架構和DevOps推理專家模型。它在特定數據集上進行了微調，具備出色的編碼、推理和解決問題的能力，且小模型尺寸允許在本地桌面和移動設備上運行，同時支持超快速的服務器推理。

🚀 快速開始

模型信息

屬性	詳情
庫名稱	transformers
任務類型	文本生成
基礎模型	Qwen/Qwen3 - 4B
模型類型	Esper 3：[Qwen3 - 4B](https://huggingface.co/ValiantLabs/Qwen3 - 4B - Esper3)，[Qwen3 - 8B](https://huggingface.co/ValiantLabs/Qwen3 - 8B - Esper3)，[Qwen3 - 14B](https://huggingface.co/ValiantLabs/Qwen3 - 14B - Esper3)
訓練數據	[sequelbox/Titanium2.1 - DeepSeek - R1](https://huggingface.co/datasets/sequelbox/Titanium2.1 - DeepSeek - R1)，[sequelbox/Tachibana2 - DeepSeek - R1](https://huggingface.co/datasets/sequelbox/Tachibana2 - DeepSeek - R1)，[sequelbox/Raiden - DeepSeek - R1](https://huggingface.co/datasets/sequelbox/Raiden - DeepSeek - R1)
許可證	apache - 2.0

支持開源

支持我們的開源數據集和模型發佈！

![圖片](https://cdn - uploads.huggingface.co/production/uploads/64f267a8a4f79a118e0fcc89/qdicXwrO_XOKRTjOu2yBF.jpeg)

✨ 主要特性

專業微調：在我們使用Deepseek R1生成的[DevOps和架構推理](https://huggingface.co/datasets/sequelbox/Titanium2.1 - DeepSeek - R1)以及[代碼推理](https://huggingface.co/datasets/sequelbox/Tachibana2 - DeepSeek - R1)數據上進行了微調。
推理能力提升：改進了[通用和創造性推理](https://huggingface.co/datasets/sequelbox/Raiden - DeepSeek - R1)，以補充解決問題和通用聊天性能。
輕量級運行：小模型尺寸允許在本地桌面和移動設備上運行，同時支持超快速的服務器推理。

💻 使用示例

基礎用法

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "ValiantLabs/Qwen3-4B-Esper3"

# 加載分詞器和模型
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)

# 準備模型輸入
prompt = "Write a Terraform configuration that uses the `aws_ami` data source to find the latest Amazon Linux 2 AMI. Then, provision an EC2 instance using this dynamically determined AMI ID."
messages = [
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
    enable_thinking=True # 在思考和非思考模式之間切換。默認值為True。
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

# 進行文本生成
generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=32768
)
output_ids = generated_ids[0][len(model_inputs.input_ids[0]):].tolist() 

# 解析思考內容
try:
    # rindex查找151668 (</think>)
    index = len(output_ids) - output_ids[::-1].index(151668)
except ValueError:
    index = 0

thinking_content = tokenizer.decode(output_ids[:index], skip_special_tokens=True).strip("\n")
content = tokenizer.decode(output_ids[index:], skip_special_tokens=True).strip("\n")

print("thinking content:", thinking_content)
print("content:", content)