W

Westlake 7B V2 Laser Truthy Dpo

由macadeliccc開發
基於WestLake-7B-v2-laser模型在truthy-dpo-v0.1數據集上進行微調的大語言模型,專注於文本生成任務,在多項基準測試中表現優異。
下載量 9,693
發布時間 : 1/27/2024

模型概述

這是一個7B參數規模的大語言模型,經過DPO(Direct Preference Optimization)微調,擅長生成高質量文本響應。模型在AI2推理挑戰賽、HellaSwag等多個基準測試中取得良好成績。

模型特點

DPO微調優化
使用truthy-dpo-v0.1數據集進行直接偏好優化訓練,提升了模型生成質量
多基準測試表現優異
在AI2推理挑戰賽、HellaSwag等多個標準測試中取得高於平均水平的成績
多格式支持
支持ChatML和原始Mistral對話模板格式,適應不同應用場景

模型能力

文本生成
多輪對話
指令跟隨
知識問答

使用案例

對話系統
智能客服
用於構建能夠理解用戶需求並提供有用響應的客服系統
能生成禮貌且有幫助的響應
教育輔助
學習助手
幫助學生解答問題和解釋概念
在MMLU測試中達到64.84%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase