TinyLlama免費開源！1.1B參數模型提供緊湊高效文本生成能力

首頁

Tinyllama 1.1B Intermediate Step 1431k 3T

由TinyLlama開發

TinyLlama是一個1.1B參數的Llama模型，預訓練使用了3萬億標記，旨在提供緊湊高效的文本生成能力。

大型語言模型

Transformers

英語開源協議:Apache-2.0 #輕量級Llama #高效預訓練 #多任務文本生成

下載量 25.04k

發布時間 : 12/28/2023

模型概述

TinyLlama項目旨在預訓練一個1.1B參數的Llama模型，使用3萬億標記。通過優化，可以在90天內使用16塊A100-40G GPU完成訓練。

模型特點

高效預訓練

使用3萬億標記進行預訓練，優化後可在90天內完成訓練。

緊湊模型

僅有1.1B參數，適合計算和內存佔用有限制的應用場景。

兼容性

採用與Llama 2相同的架構和分詞器，可即插即用到許多基於Llama的開源項目中。

模型能力

文本生成

推理任務

問答系統

使用案例

自然語言處理

AI2推理挑戰賽

用於解決AI2推理挑戰賽中的問題

標準化準確率33.87

HellaSwag

用於HellaSwag數據集上的文本生成任務

標準化準確率60.31

教育

MMLU

用於多任務語言理解評估

準確率26.04

🚀 TinyLlama-1.1B

TinyLlama項目旨在對一個11億參數的Llama模型進行預訓練，訓練數據量達到3萬億個詞元。通過適當的優化，使用16張A100 - 40G GPU，我們可以在“僅”90天的時間內完成這一目標🚀🚀。訓練已於2023年9月1日啟動。

🚀 快速開始

TinyLlama項目的代碼倉庫鏈接為：https://github.com/jzhang38/TinyLlama 。該項目採用了與Llama 2完全相同的架構和分詞器，這意味著TinyLlama可以在許多基於Llama構建的開源項目中直接使用。此外，TinyLlama僅有11億參數，這種輕量級的特性使其能夠適用於許多對計算和內存要求較低的應用場景。

✨ 主要特性

架構兼容：採用與Llama 2相同的架構和分詞器，可無縫融入基於Llama的開源項目。
輕量級設計：僅11億參數，適合對計算和內存要求有限的應用。
大規模訓練：計劃在3萬億詞元上進行預訓練，有望提升模型性能。

📚 詳細文檔

模型集合

此集合包含1萬億詞元修復後的所有檢查點。分支名稱表示步數和已處理的詞元數量。

評估結果

模型	預訓練詞元數	HellaSwag	Obqa	WinoGrande	ARC_c	ARC_e	boolq	piqa	平均
Pythia-1.0B	300B	47.16	31.40	53.43	27.05	48.99	60.83	69.21	48.30
TinyLlama-1.1B-intermediate-step-50K-104b	103B	43.50	29.80	53.28	24.32	44.91	59.66	67.30	46.11
TinyLlama-1.1B-intermediate-step-240k-503b	503B	49.56	31.40	55.80	26.54	48.32	56.91	69.42	48.28
TinyLlama-1.1B-intermediate-step-480k-1007B	1007B	52.54	33.40	55.96	27.82	52.36	59.54	69.91	50.22
TinyLlama-1.1B-intermediate-step-715k-1.5T	1.5T	53.68	35.20	58.33	29.18	51.89	59.08	71.65	51.29
TinyLlama-1.1B-intermediate-step-955k-2T	2T	54.63	33.40	56.83	28.07	54.67	63.21	70.67	51.64
TinyLlama-1.1B-intermediate-step-1195k-2.5T	2.5T	58.96	34.40	58.72	31.91	56.78	63.21	73.07	53.86
TinyLlama-1.1B-intermediate-step-1431k-3T	3T	59.20	36.00	59.12	30.12	55.25	57.83	73.29	52.99

Open LLM Leaderboard評估結果

詳細結果可查看此處

指標	值
平均值	36.42
AI2推理挑戰 (25次少樣本)	33.87
HellaSwag (10次少樣本)	60.31
MMLU (5次少樣本)	26.04
TruthfulQA (0次少樣本)	37.32
Winogrande (5次少樣本)	59.51
GSM8k (5次少樣本)	1.44