DeepHermes 3預覽版Abliterated開源大語言模型 - 集推理與常規響應於一體！

首頁

Deephermes 3 Llama 3 3B Preview Abliterated

由prithivMLmods開發

DeepHermes 3預覽版Abliterated是Nous Research旗艦級Hermes系列大語言模型的最新版本，整合了推理與常規LLM響應模式。

大型語言模型

Transformers

英語開源協議:Apache-2.0 #思維鏈推理 #混合響應模式 #函數調用優化

下載量 338

發布時間 : 3/19/2025

模型概述

該模型是全球首批將推理（通過長思維鏈提升答案准確性）與常規LLM響應模式統一到一個模型中的先驅之一，優化了註釋生成、判斷能力和函數調用功能。

模型特點

混合推理模式

首次實現'直覺式'傳統響應與長思維鏈推理響應的系統提示切換集成

增強功能支持

優化了註釋生成、判斷能力和函數調用功能

結構化思維輸出

支持將思考過程包裹在<think></think>標籤中，實現可解釋性推理

模型能力

文本生成

複雜推理

問題解決

註釋生成

函數調用

使用案例

科研輔助

數學問題求解

通過長思維鏈解決複雜數學問題

提供分步推理過程和最終答案

編程輔助

代碼註釋生成

為代碼片段生成詳細註釋

提高代碼可讀性和維護性

決策支持

邏輯分析

對複雜問題進行系統性分析

提供結構化思考過程和解決方案

🚀 DeepHermes-3-Llama-3-3B-Preview-Abliterated

DeepHermes 3 Preview Abliterated 是 Nous Research 旗艦 Hermes 系列大語言模型（LLM）的最新版本，也是全球首批將推理（能提高答案准確性的長思維鏈）和普通大語言模型響應模式統一到一個模型中的模型之一。我們還改進了大語言模型的註釋、判斷和函數調用功能。DeepHermes 3 Preview Abliterated 是一個混合推理模型，也是首批將“直覺”傳統模式響應和長思維鏈推理響應統一到單個模型中的大語言模型之一，可通過系統提示進行切換。

🚀 快速開始

環境準備

確保你已經安裝了必要的庫，如 torch、transformers 和 flash_attn。

代碼示例

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
import flash_attn
import time

tokenizer = AutoTokenizer.from_pretrained("prithivMLmods/DeepHermes-3-Llama-3-3B-Preview-Abliterated")

model = AutoModelForCausalLM.from_pretrained(
    "prithivMLmods/DeepHermes-3-Llama-3-3B-Preview-Abliterated",
    torch_dtype=torch.float16,
    device_map="auto",
    attn_implementation="flash_attention_2",
)

messages = [
    {
        "role": "system",
        "content": "You are a deep thinking AI, you may use extremely long chains of thought to deeply consider the problem and deliberate with yourself via systematic reasoning processes to help come to a correct solution prior to answering. You should enclose your thoughts and internal monologue inside <think> </think> tags, and then provide your solution or response to the problem."
    },
    {
        "role": "user",
        "content": "What is y if y=2*2-4+(3*2)"
    }
]

input_ids = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors='pt').to("cuda")
generated_ids = model.generate(input_ids, max_new_tokens=2500, temperature=0.8, repetition_penalty=1.1, do_sample=True, eos_token_id=tokenizer.eos_token_id)
print(f"Generated Tokens: {generated_ids.shape[-1:]}")
response = tokenizer.decode(generated_ids[0], skip_special_tokens=True, clean_up_tokenization_space=True)
print(f"Response: {response}")

✨ 主要特性

模式統一：將推理和普通大語言模型響應模式統一到一個模型中，可通過系統提示切換。
功能改進：改進了大語言模型的註釋、判斷和函數調用功能。
混合推理：支持“直覺”傳統模式響應和長思維鏈推理響應。

📚 詳細文檔

預期用途

DeepHermes-3-Llama-3-3B-Preview-Abliterated 旨在用於高級推理、問題解決和結構化思維生成。它無縫集成了直覺響應生成和深度思維鏈推理，非常適合需要邏輯演繹、複雜問題分析和人工智能輔助決策的任務。憑藉改進的註釋、判斷和函數調用功能，該模型非常適合研究、自動化、編碼輔助以及對準確性和可解釋性要求較高的人工智能驅動的學術或專業應用。