N

Neuralhermes 2.5 Mistral 7B

由mlabonne開發
NeuralHermes是基於OpenHermes-2.5-Mistral-7B模型,通過直接偏好優化(DPO)進一步微調而成的大語言模型,在多項基準測試中表現優異。
下載量 215
發布時間 : 11/29/2023

模型概述

該模型是一個7B參數的大語言模型,採用ChatML模板格式,專注於文本生成任務。通過DPO微調提升了原始模型的性能,在開放大語言模型排行榜上表現突出。

模型特點

DPO微調優化
使用直接偏好優化(DPO)方法對基礎模型進行微調,顯著提升了模型性能
ChatML格式支持
採用ChatML模板格式,便於聊天應用場景的使用
多基準測試領先
在開放大語言模型排行榜上表現優異,是7B參數模型中的佼佼者
高效訓練
僅需約1小時A100 GPU即可完成訓練,訓練效率高

模型能力

文本生成
聊天對話
問答系統
指令跟隨

使用案例

智能助手
聊天機器人
可作為智能聊天助手,提供自然流暢的對話體驗
在TruthfulQA基準測試中達到54.93%的準確率
知識問答
開放領域問答
回答各種領域的知識性問題
在MMLU基準測試中達到63.32%的準確率
推理任務
邏輯推理
處理需要邏輯推理的問題
在AI2推理挑戰賽中達到66.55%的準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase