Llama3.1-1B-Neo-BAAI-1000k開源語言模型 - 高效文本處理，基於百萬數據訓練

Llama3.1 1B Neo BAAI 1000k

由yang31210999開發

Llama3.1-Neo-1B-100w是基於Meta-Llama-3.1-8B-Instruct剪枝至1.4B參數規模，並採用LLM-Neo方法（結合LoRA與知識蒸餾）微調的高效語言模型。訓練數據採樣自BAAI/Infinity-Instruct的100萬行數據。

下載量 39

發布時間 : 9/10/2024

模型概述

該模型是一個高效參數知識蒸餾後的大型語言模型，專注於文本生成任務，適用於多種自然語言處理場景。

高效參數知識蒸餾

採用LLM-Neo方法結合LoRA與知識蒸餾技術，顯著減少模型參數量的同時保持性能

輕量化設計

從8B參數剪枝至1.4B，大幅降低計算資源需求

高質量微調數據

使用BAAI/Infinity-Instruct數據集中的精選100萬行數據進行微調

文本生成

問答系統

指令跟隨

知識推理

教育

學術問答系統

用於回答學生提出的各類學術問題

在CEVAL高等數學子集上達到31.58%準確率

商業

會計知識問答

處理基礎會計相關問題

在CEVAL會計子集上達到24.49%準確率

通用AI助手

日常問題解答

回答日常生活中的各種問題

在PIQA基準測試中達到58.43%準確率

類別	基準測試	版本	指標	值	標準誤差
ARC	ARC - Challenge	1	acc	0.1920	± 0.0115
ARC	ARC - Easy	1	acc	0.3834	± 0.0100
CEVAL	CEVAL (valid)	N/A	acc	0.2370	± 0.0117
CEVAL	CEVAL (Accountant)	1	acc	0.2449	± 0.0621
CEVAL	CEVAL (Advanced Mathematics)	1	acc	0.3158	± 0.1096
MMLU	MMLU	N/A	acc	0.2439	± 0.0036
MMLU	MMLU (Abstract Algebra)	0	acc	0.2500	± 0.0435
PIQA	PIQA	1	acc	0.5843	± 0.0115
PIQA	PIQA (Normalized)	1	acc_norm	0.5822	± 0.0115
Winogrande	Winogrande	1	acc	0.5249	± 0.0140