Z

Zephyr 7b Gemma V0.1

由HuggingFaceH4開發
Zephyr 7B Gemma是基於google/gemma-7b微調的語言模型,使用直接偏好優化(DPO)在公開合成數據集上訓練,旨在作為有用的助手。
下載量 502
發布時間 : 3/1/2024

模型概述

Zephyr系列語言模型的第三個版本,70億參數規模,主要用於英語文本生成任務,經過對齊優化以提供更符合人類偏好的響應。

模型特點

直接偏好優化(DPO)
使用DPO方法在合成數據集上進行微調,使模型輸出更符合人類偏好
高性能
在多個基準測試中表現優異,如MT-Bench得分7.81
開源訓練配方
可通過對齊手冊提供的配方重現訓練過程

模型能力

文本生成
對話系統
問答系統
推理任務

使用案例

對話系統
智能助手
可作為日常對話助手使用
在MT-Bench對話評估中獲得7.81分
知識問答
AI2推理挑戰賽
解決複雜的推理問題
25-shot下標準化準確率58.45
數學推理
GSM8k數學題
解決小學數學應用題
5-shot準確率45.56
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase