N

Nous Hermes 2 Mistral 7B DPO AWQ

Developed by solidrust
Nous Hermes 2是基於Mistral 7B DPO的新一代旗艦級7B Hermes模型,經過DPO優化,在多個測試基準上表現優異。
Downloads 84
Release Time : 2/22/2024

Model Overview

該模型是基於Mistral 7B架構的大語言模型,經過DPO(直接偏好優化)訓練,專注於指令遵循和對話生成任務。

Model Features

DPO優化
經過直接偏好優化訓練,在AGIEval、BigBench Reasoning等基準測試中表現更優
高質量訓練數據
使用100萬條GPT-4質量或更優的指令/對話數據進行訓練
AWQ量化支持
支持4位AWQ量化,在保持質量的同時提高推理效率
ChatML格式支持
使用標準化的ChatML提示模板,便於對話系統集成

Model Capabilities

文本生成
對話系統
指令遵循
推理能力

Use Cases

對話系統
智能助手
構建能夠理解複雜指令並生成自然回應的AI助手
在多個基準測試中表現優於基礎模型
教育應用
教學輔助
用於生成教學內容和解答學生問題
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase