e.star.7.b開源大語言模型 - 基於Mistral架構，多項測試表現優異可高效訓練

E.star.7.b

由liminerity開發

基於Mistral架構的7B參數大語言模型，使用Unsloth和TRL庫高效訓練，在多項基準測試中表現優異。

下載量 86

發布時間 : 3/24/2024

模型概述

這是一個文本生成模型，基於yam-peleg/Experiment26-7B微調而來，專注於提供高質量的文本生成能力。

高效訓練

使用Unsloth和TRL庫訓練，速度提升2倍

多任務表現

在AI2推理挑戰賽、HellaSwag等多個基準測試中表現優異

開源許可

採用Apache 2.0許可證，允許商業使用

文本生成

問答系統

推理任務

知識問答

教育

知識問答

回答各類學科知識問題

在MMLU測試中準確率達63.44%

研究

推理任務

解決邏輯推理問題

在AI2推理挑戰賽中標準化準確率達63.91%

商業

內容生成

生成各類商業文本內容

任務數據集	指標	值	來源
AI2 Reasoning Challenge (25 - Shot)	歸一化準確率	63.91	Open LLM Leaderboard
HellaSwag (10 - Shot)	歸一化準確率	86.02	Open LLM Leaderboard
MMLU (5 - Shot)	準確率	63.44	Open LLM Leaderboard
TruthfulQA (0 - shot)	mc2	54.91	Open LLM Leaderboard
Winogrande (5 - shot)	準確率	80.19	Open LLM Leaderboard
GSM8k (5 - shot)	準確率	61.18	Open LLM Leaderboard