DeepHat-V1-7B開源模型 - 免費部署助力網絡安全攻防與DevOps工作

Home

Deephat V1 7B

Developed by DeepHat

DeepHat 是一系列可用於網絡安全攻防的模型，基於 Qwen2.5-Coder-7B 微調，專注於網絡安全和 DevOps 領域。

大型語言模型

Transformers

Supports Multiple LanguagesOpen Source License:Apache-2.0 #網絡安全攻防 #長文本處理 #自迴歸語言模型

Downloads 2,025

Release Time : 4/25/2025

Model Overview

DeepHat 是一個自迴歸語言模型，專為網絡安全攻防和 DevOps 任務設計，具備長文本處理能力和強大的代碼生成能力。

Model Features

長文本處理能力

支持長達 131,072 個標記的上下文長度，採用 YaRN 技術增強長文本處理能力。

網絡安全專家

專注於網絡安全領域，能夠協助進行攻防分析和安全相關任務。

代碼生成能力

基於 Qwen2.5-Coder-7B 微調，具備強大的代碼理解和生成能力。

高級架構

採用 RoPE、SwiGLU、RMSNorm 和注意力 QKV 偏置的 Transformer 架構。

Model Capabilities

文本生成

代碼生成

網絡安全分析

長文本處理

DevOps 任務協助

Use Cases

網絡安全

安全漏洞分析

協助識別和分析潛在的安全漏洞

提高安全防護能力

攻防演練

模擬攻擊和防禦場景

增強安全團隊實戰能力

軟件開發

算法實現

快速生成各種算法實現代碼

提高開發效率

DevOps 自動化

協助編寫自動化腳本和部署流程

簡化運維工作

🚀 DeepHat - 攻防一體的網絡安全模型

DeepHat 是一系列可用於網絡安全攻防的模型。你可以通過 whiterabbitneo.com 訪問，或者前往 Kindo.ai 創建智能體。

DeepHat

模型信息

屬性	詳情
基礎模型	Qwen/Qwen2.5-Coder-7B
類型	自迴歸語言模型
訓練階段	預訓練與後訓練
架構	採用 RoPE、SwiGLU、RMSNorm 和注意力 QKV 偏置的 Transformer 架構
參數數量	76.1 億
非嵌入參數數量	65.3 億
層數	28
注意力頭數量（GQA）	Q 為 28，KV 為 4
上下文長度	完整 131,072 個標記

🚀 快速開始

以下代碼片段展示瞭如何使用 apply_chat_template 加載分詞器和模型，並生成內容。

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "DeepHat/DeepHat-V1-7B"

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "write a quick sort algorithm."
messages = [
    {"role": "system", "content": "You are DeepHat, created by Kindo.ai. You are a helpful assistant that is an expert in Cybersecurity and DevOps."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=512
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

處理長文本

當前的 config.json 配置支持的上下文長度為 32,768 個標記。為了處理超過 32,768 個標記的長輸入，我們採用了 YaRN 技術，該技術可增強模型的長度外推能力，確保在長文本上的最佳性能。對於支持的框架，你可以在 config.json 中添加以下內容以啟用 YaRN：

{
  ...,
  "rope_scaling": {
    "factor": 4.0,
    "original_max_position_embeddings": 32768,
    "type": "yarn"
  }
}

✨ 主要特性

DeepHat 是 Qwen2.5-Coder-7B 的微調模型，繼承了以下特性：

類型：自迴歸語言模型
訓練階段：預訓練與後訓練
架構：採用 RoPE、SwiGLU、RMSNorm 和注意力 QKV 偏置的 Transformer 架構
上下文長度：完整 131,072 個標記

🔧 技術細節

要求

建議使用最新版本的 transformers。如果使用 transformers<4.37.0，將會遇到以下錯誤：

KeyError: 'qwen2'

📄 許可證

本模型採用 Apache-2.0 + DeepHat 擴展版本許可證。

DeepHat 對 Apache-2.0 許可證的擴展：使用限制

您同意不以以下方式使用本模型或其衍生模型：

- 以任何違反適用的國家或國際法律、法規，或侵犯任何第三方合法權益的方式使用；
- 以任何方式用於軍事用途；
- 以任何方式用於剝削、傷害或試圖剝削、傷害未成年人；
- 為傷害他人而生成或傳播可驗證的虛假信息和/或內容；
- 生成或傳播符合適用監管要求的不適當內容；
- 在未獲得適當授權或用於不合理用途的情況下生成或傳播個人可識別信息；
- 誹謗、詆譭或以其他方式騷擾他人；
- 用於對個人合法權利產生不利影響或以其他方式創建或修改具有約束力、可強制執行義務的全自動決策；
- 用於基於在線或離線社會行為、已知或預測的個人或個性特徵對個人或群體進行歧視或傷害的任何用途；
- 利用特定人群基於其年齡、社會、身體或精神特徵的任何弱點，以導致或可能導致該人或他人身體或心理傷害的方式實質性扭曲該群體中某個人的行為；
- 用於基於法律保護的特徵或類別對個人或群體進行歧視的任何用途。