DeepHat-V1-7B开源模型 - 免费部署助力网络安全攻防与DevOps工作

首页

Deephat V1 7B

由 DeepHat 开发

DeepHat 是一系列可用于网络安全攻防的模型，基于 Qwen2.5-Coder-7B 微调，专注于网络安全和 DevOps 领域。

大型语言模型

Transformers

支持多种语言开源协议:Apache-2.0 #网络安全攻防 #长文本处理 #自回归语言模型

下载量 2,025

发布时间 : 4/25/2025

模型简介

DeepHat 是一个自回归语言模型，专为网络安全攻防和 DevOps 任务设计，具备长文本处理能力和强大的代码生成能力。

模型特点

长文本处理能力

支持长达 131,072 个标记的上下文长度，采用 YaRN 技术增强长文本处理能力。

网络安全专家

专注于网络安全领域，能够协助进行攻防分析和安全相关任务。

代码生成能力

基于 Qwen2.5-Coder-7B 微调，具备强大的代码理解和生成能力。

高级架构

采用 RoPE、SwiGLU、RMSNorm 和注意力 QKV 偏置的 Transformer 架构。

模型能力

文本生成

代码生成

网络安全分析

长文本处理

DevOps 任务协助

使用案例

网络安全

安全漏洞分析

协助识别和分析潜在的安全漏洞

提高安全防护能力

攻防演练

模拟攻击和防御场景

增强安全团队实战能力

软件开发

算法实现

快速生成各种算法实现代码

提高开发效率

DevOps 自动化

协助编写自动化脚本和部署流程

简化运维工作

🚀 DeepHat - 攻防一体的网络安全模型

DeepHat 是一系列可用于网络安全攻防的模型。你可以通过 whiterabbitneo.com 访问，或者前往 Kindo.ai 创建智能体。

DeepHat

模型信息

属性	详情
基础模型	Qwen/Qwen2.5-Coder-7B
类型	自回归语言模型
训练阶段	预训练与后训练
架构	采用 RoPE、SwiGLU、RMSNorm 和注意力 QKV 偏置的 Transformer 架构
参数数量	76.1 亿
非嵌入参数数量	65.3 亿
层数	28
注意力头数量（GQA）	Q 为 28，KV 为 4
上下文长度	完整 131,072 个标记

🚀 快速开始

以下代码片段展示了如何使用 apply_chat_template 加载分词器和模型，并生成内容。

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "DeepHat/DeepHat-V1-7B"

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "write a quick sort algorithm."
messages = [
    {"role": "system", "content": "You are DeepHat, created by Kindo.ai. You are a helpful assistant that is an expert in Cybersecurity and DevOps."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=512
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

处理长文本

当前的 config.json 配置支持的上下文长度为 32,768 个标记。为了处理超过 32,768 个标记的长输入，我们采用了 YaRN 技术，该技术可增强模型的长度外推能力，确保在长文本上的最佳性能。对于支持的框架，你可以在 config.json 中添加以下内容以启用 YaRN：

{
  ...,
  "rope_scaling": {
    "factor": 4.0,
    "original_max_position_embeddings": 32768,
    "type": "yarn"
  }
}

✨ 主要特性

DeepHat 是 Qwen2.5-Coder-7B 的微调模型，继承了以下特性：

类型：自回归语言模型
训练阶段：预训练与后训练
架构：采用 RoPE、SwiGLU、RMSNorm 和注意力 QKV 偏置的 Transformer 架构
上下文长度：完整 131,072 个标记

🔧 技术细节

要求

建议使用最新版本的 transformers。如果使用 transformers<4.37.0，将会遇到以下错误：

KeyError: 'qwen2'

📄 许可证

本模型采用 Apache-2.0 + DeepHat 扩展版本许可证。

DeepHat 对 Apache-2.0 许可证的扩展：使用限制

您同意不以以下方式使用本模型或其衍生模型：

- 以任何违反适用的国家或国际法律、法规，或侵犯任何第三方合法权益的方式使用；
- 以任何方式用于军事用途；
- 以任何方式用于剥削、伤害或试图剥削、伤害未成年人；
- 为伤害他人而生成或传播可验证的虚假信息和/或内容；
- 生成或传播符合适用监管要求的不适当内容；
- 在未获得适当授权或用于不合理用途的情况下生成或传播个人可识别信息；
- 诽谤、诋毁或以其他方式骚扰他人；
- 用于对个人合法权利产生不利影响或以其他方式创建或修改具有约束力、可强制执行义务的全自动决策；
- 用于基于在线或离线社会行为、已知或预测的个人或个性特征对个人或群体进行歧视或伤害的任何用途；
- 利用特定人群基于其年龄、社会、身体或精神特征的任何弱点，以导致或可能导致该人或他人身体或心理伤害的方式实质性扭曲该群体中某个人的行为；
- 用于基于法律保护的特征或类别对个人或群体进行歧视的任何用途。