N

Nous Hermes 2 Mistral 7B DPO AWQ

由solidrust開發
Nous Hermes 2是基於Mistral 7B DPO的新一代旗艦級7B Hermes模型,經過DPO優化,在多個測試基準上表現優異。
下載量 84
發布時間 : 2/22/2024

模型概述

該模型是基於Mistral 7B架構的大語言模型,經過DPO(直接偏好優化)訓練,專注於指令遵循和對話生成任務。

模型特點

DPO優化
經過直接偏好優化訓練,在AGIEval、BigBench Reasoning等基準測試中表現更優
高質量訓練數據
使用100萬條GPT-4質量或更優的指令/對話數據進行訓練
AWQ量化支持
支持4位AWQ量化,在保持質量的同時提高推理效率
ChatML格式支持
使用標準化的ChatML提示模板,便於對話系統集成

模型能力

文本生成
對話系統
指令遵循
推理能力

使用案例

對話系統
智能助手
構建能夠理解複雜指令並生成自然回應的AI助手
在多個基準測試中表現優於基礎模型
教育應用
教學輔助
用於生成教學內容和解答學生問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase