llama2_7b_mmlu開源AI模型 - 提升MMLU指標且穩定其他指標表現

首頁

Llama2 7b Mmlu

由itsliupeng開發

基於Llama-2-7b-hf模型在MMLU數據集上持續訓練，提升MMLU指標表現的同時保持其他指標穩定

大型語言模型

Transformers

英語開源協議:Apache-2.0 #MMLU性能優化 #多任務文本生成 #低資源高效推理

下載量 120

發布時間 : 10/10/2023

模型概述

該模型是Llama-2-7b-hf的改進版本，通過mmlu_recall數據集進行持續訓練，專注於提升在MMLU基準測試中的表現，同時確保其他能力指標不受影響。

模型特點

MMLU性能提升

通過mmlu_recall數據集持續訓練，MMLU指標達到60.04，相比原版有顯著提升

多任務能力保持

在提升MMLU表現的同時，保持了ARC、HellaSwag等其他基準測試的穩定性能

開源許可

採用Apache-2.0許可證，允許商業和研究使用

模型能力

文本生成

知識問答

語言理解

推理能力

使用案例

教育

學術問答系統

用於回答各類學術問題，特別是需要廣泛知識面的問題

在MMLU基準測試中表現優異

研究

模型性能研究

研究持續訓練對特定指標的影響

實現了特定指標提升而不影響其他能力

指標	數值
平均值	46.31
ARC (25-shot)	56.14
HellaSwag (10-shot)	79.13
MMLU (5-shot)	60.04
TruthfulQA (0-shot)	40.95
Winogrande (5-shot)	74.43
GSM8K (5-shot)	7.88
DROP (3-shot)	5.59

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Llama2 7b Mmlu

模型概述

模型特點

模型能力

使用案例

🚀 基於Llama-2-7b-hf的文本生成模型

🚀 快速開始

✨ 主要特性

📚 詳細文檔

Open LLM Leaderboard評估結果

📄 許可證