TinyLlama免费开源！1.1B参数模型提供紧凑高效文本生成能力

首页

Tinyllama 1.1B Intermediate Step 1431k 3T

由 TinyLlama 开发

TinyLlama是一个1.1B参数的Llama模型，预训练使用了3万亿标记，旨在提供紧凑高效的文本生成能力。

大型语言模型

Transformers

英语开源协议:Apache-2.0 #轻量级Llama #高效预训练 #多任务文本生成

下载量 25.04k

发布时间 : 12/28/2023

模型简介

TinyLlama项目旨在预训练一个1.1B参数的Llama模型，使用3万亿标记。通过优化，可以在90天内使用16块A100-40G GPU完成训练。

模型特点

高效预训练

使用3万亿标记进行预训练，优化后可在90天内完成训练。

紧凑模型

仅有1.1B参数，适合计算和内存占用有限制的应用场景。

兼容性

采用与Llama 2相同的架构和分词器，可即插即用到许多基于Llama的开源项目中。

模型能力

文本生成

推理任务

问答系统

使用案例

自然语言处理

AI2推理挑战赛

用于解决AI2推理挑战赛中的问题

标准化准确率33.87

HellaSwag

用于HellaSwag数据集上的文本生成任务

标准化准确率60.31

教育

MMLU

用于多任务语言理解评估

准确率26.04

🚀 TinyLlama-1.1B

TinyLlama项目旨在对一个11亿参数的Llama模型进行预训练，训练数据量达到3万亿个词元。通过适当的优化，使用16张A100 - 40G GPU，我们可以在“仅”90天的时间内完成这一目标🚀🚀。训练已于2023年9月1日启动。

🚀 快速开始

TinyLlama项目的代码仓库链接为：https://github.com/jzhang38/TinyLlama 。该项目采用了与Llama 2完全相同的架构和分词器，这意味着TinyLlama可以在许多基于Llama构建的开源项目中直接使用。此外，TinyLlama仅有11亿参数，这种轻量级的特性使其能够适用于许多对计算和内存要求较低的应用场景。

✨ 主要特性

架构兼容：采用与Llama 2相同的架构和分词器，可无缝融入基于Llama的开源项目。
轻量级设计：仅11亿参数，适合对计算和内存要求有限的应用。
大规模训练：计划在3万亿词元上进行预训练，有望提升模型性能。

📚 详细文档

模型集合

此集合包含1万亿词元修复后的所有检查点。分支名称表示步数和已处理的词元数量。

评估结果

模型	预训练词元数	HellaSwag	Obqa	WinoGrande	ARC_c	ARC_e	boolq	piqa	平均
Pythia-1.0B	300B	47.16	31.40	53.43	27.05	48.99	60.83	69.21	48.30
TinyLlama-1.1B-intermediate-step-50K-104b	103B	43.50	29.80	53.28	24.32	44.91	59.66	67.30	46.11
TinyLlama-1.1B-intermediate-step-240k-503b	503B	49.56	31.40	55.80	26.54	48.32	56.91	69.42	48.28
TinyLlama-1.1B-intermediate-step-480k-1007B	1007B	52.54	33.40	55.96	27.82	52.36	59.54	69.91	50.22
TinyLlama-1.1B-intermediate-step-715k-1.5T	1.5T	53.68	35.20	58.33	29.18	51.89	59.08	71.65	51.29
TinyLlama-1.1B-intermediate-step-955k-2T	2T	54.63	33.40	56.83	28.07	54.67	63.21	70.67	51.64
TinyLlama-1.1B-intermediate-step-1195k-2.5T	2.5T	58.96	34.40	58.72	31.91	56.78	63.21	73.07	53.86
TinyLlama-1.1B-intermediate-step-1431k-3T	3T	59.20	36.00	59.12	30.12	55.25	57.83	73.29	52.99

Open LLM Leaderboard评估结果

详细结果可查看此处

指标	值
平均值	36.42
AI2推理挑战 (25次少样本)	33.87
HellaSwag (10次少样本)	60.31
MMLU (5次少样本)	26.04
TruthfulQA (0次少样本)	37.32
Winogrande (5次少样本)	59.51
GSM8k (5次少样本)	1.44