DeepHermes-ToolCalling-Specialist-Atropos開源模型 - 提升推理工具調用性能，免費使用！

首頁

Deephermes ToolCalling Specialist Atropos

由NousResearch開發

由Nous Research使用Atropos強化學習框架微調的實驗性模型，專注於提升Llama-3.1 8B模型在推理模式下的工具調用性能

大型語言模型

Transformers

英語#強化學習微調 #推理模式工具調用 #並行函數執行

下載量 64

發布時間 : 4/11/2025

模型概述

基於DeepHermes 3 Llama-3.1 8B模型，通過Atropos強化學習框架專門優化了工具調用能力，特別適合複雜推理任務中的工具使用場景

模型特點

強化學習優化的工具調用

通過Atropos強化學習框架顯著提升了模型在推理模式下的工具調用準確率

開源強化學習框架

基於完全開源的Atropos強化學習環境棧開發

多模式推理支持

支持深度推理模式、標準對話/指令模式、結構化JSON輸出和函數調用

模型能力

複雜推理任務處理

並行工具調用

結構化JSON輸出生成

函數調用執行

指令跟隨

使用案例

工具調用優化

並行函數調用

同時處理多個函數調用請求

準確率從0.10提升至0.46

簡單工具調用

基礎工具調用任務

準確率從0.21提升至0.5175

🚀 深度赫爾墨斯工具調用專家 - 阿特洛波斯強化學習

深度赫爾墨斯工具調用專家 - 阿特洛波斯強化學習模型是由Nous Research使用其創新的開源強化學習框架阿特洛波斯進行微調的實驗性產物。該變體專門提升了深度赫爾墨斯3 Llama - 3.1 8B模型在推理模式下的工具調用性能。

🚀 快速開始

本模型為實驗性產物，並非為廣泛的通用用途而設計。若你想深入瞭解和使用該模型，可參考以下各部分內容。

✨ 主要特性

推理模式下工具調用能力提升：強化學習顯著增強了模型在複雜推理任務中的工具使用能力。
開源強化學習框架：採用了完全開源的阿特洛波斯強化學習環境。
活躍的開源社區：歡迎在阿特洛波斯的GitHub上進行貢獻。
即將推出的先進強化學習訓練器：Nous Research即將推出一款最先進的開源強化學習訓練器。

📚 詳細文檔

阿特洛波斯開源框架

阿特洛波斯是Nous Research的開源強化學習環境棧，旨在通過結構化的強化學習方法增強大語言模型（LLM）功能的各個方面。我們鼓勵大家貢獻和探索： 🌐 阿特洛波斯GitHub倉庫

基準測試結果

在伯克利函數調用基準測試中的評估表明，與基礎模型相比，該模型在推理模式下的工具調用準確率有顯著提升：

基準測試	基礎準確率	阿特洛波斯強化學習準確率	提升倍數
並行測試	0.10	0.46	4.6倍
簡單測試	0.21	0.5175	2.5倍

這些提升得益於專門針對基於推理的工具調用能力進行的強化學習微調。

評估集準確率結果：

image/png

使用方法

本模型支持多種推理模式，包括：

推理（深度思考模式）
標準聊天/指令模式
結構化JSON輸出
函數調用

詳細文檔和示例推理代碼可參考：

⚠️ 重要提示

你必須先放置深度赫爾墨斯的推理系統提示，然後再追加函數調用系統提示，這樣模型才能同時進行推理和工具調用。

🌐 赫爾墨斯函數調用GitHub

📄 許可證

本模型使用llama3許可證。

🔖 引用方式

@misc{
      title={DeepHermes Tool Calling Specialist - Atropos RL},
      author={Teknium and Dakota Mahan and Roger Jin and Chen Guang and Jai Suphavadeeprasit and Jeffrey Quesnelle},
      year={2025},
      url={https://huggingface.co/NousResearch/DeepHermes-Tool-Calling-Specialist-Atropos-RL}
}