Llama-3.1-MIG-Tulu-3-8B-SFT開源模型 - 基於數據集微調實現多元應用

Llama 3.1 MIG Tulu 3 8B SFT

由xsample開發

基於自動篩選的5萬條Tulu-3-MIG數據集進行微調的Llama-3.1-8B模型

下載量 26

發布時間 : 4/17/2025

模型概述

該模型是基於Llama-3.1-8B架構，使用Tulu-3-MIG數據集進行微調的大語言模型，專注於文本生成任務。

高效數據篩選

使用MIG方法自動篩選高質量訓練數據，提升模型性能

性能優化

在多個基準測試中表現優異，特別是在ARC、BBH和GSM等任務上

開源許可

採用Apache-2.0許可證，便於商業和研究使用

文本生成

指令理解與執行

多輪對話

教育

智能輔導

幫助學生解答問題和提供學習指導

客服

自動客服

處理客戶諮詢和常見問題解答

方法	數據規模	ARC	BBH	GSM	HE	MMLU	IFEval	客觀平均	AE	MT	野生數據	主觀平均	總平均
Pool	939K	69.15	63.88	83.40	63.41	65.77	67.10	68.79	8.94	6.86	-24.66	38.40	53.59
Random	50K	74.24	64.80	70.36	51.22	63.86	61.00	64.25	8.57	7.06	-22.15	39.36	51.81
ZIP	50K	77.63	63.00	52.54	35.98	65.00	61.00	59.19	6.71	6.64	-32.10	35.69	47.44
IFD	50K	75.93	63.56	61.03	49.39	64.39	53.60	61.32	12.30	7.03	-20.20	40.83	51.08
#InsTag	50K	72.54	64.80	69.83	48.17	63.50	65.99	64.14	6.58	6.84	-20.70	38.21	51.17
DEITA	50K	78.98	66.11	74.07	49.39	64.00	64.33	66.15	10.19	6.83	-19.95	39.50	52.83
CaR	50K	78.98	69.04	71.42	52.44	65.15	56.75	65.63	12.55	6.95	-20.67	40.57	53.10
QDIT	50K	79.66	65.42	70.74	53.05	65.06	57.30	65.21	15.78	6.76	-20.56	41.03	53.12
MIG	50K	80.00	66.39	72.02	57.93	64.44	65.06	67.64	14.66	7.32	-17.77	42.99	55.32