TinyLlama開源小型模型 - 適用於資源有限環境，免費部署超實用

Tinyllama 1.1B Intermediate Step 1195k Token 2.5T

由TinyLlama開發

TinyLlama是一個1.1B參數的小型Llama模型，在3萬億token上預訓練，設計用於資源有限的環境。

下載量 419

發布時間 : 12/11/2023

模型概述

TinyLlama項目旨在預訓練一個1.1B參數的Llama模型，使用16塊A100-40G GPU在90天內完成。模型採用與Llama 2相同的架構和分詞器，適用於多種基於Llama的開源項目。

高效訓練

使用16塊A100-40G GPU在90天內完成3萬億token的預訓練。

緊湊結構

僅有1.1B參數，適合計算和內存資源有限的應用場景。

兼容性

採用與Llama 2相同的架構和分詞器，可即插即用地應用於基於Llama的開源項目。

文本生成

語言理解

自然語言處理

文本生成

生成連貫的英文文本

語言理解

理解並回答英文問題

模型	預訓練Token數	HellaSwag	Obqa	WinoGrande	ARC_c	ARC_e	boolq	piqa	平均
Pythia-1.0B	300B	47.16	31.40	53.43	27.05	48.99	60.83	69.21	48.30
TinyLlama-1.1B-intermediate-step-50K-104b	103B	43.50	29.80	53.28	24.32	44.91	59.66	67.30	46.11
TinyLlama-1.1B-intermediate-step-240k-503b	503B	49.56	31.40	55.80	26.54	48.32	56.91	69.42	48.28
TinyLlama-1.1B-intermediate-step-480k-1007B	1007B	52.54	33.40	55.96	27.82	52.36	59.54	69.91	50.22
TinyLlama-1.1B-intermediate-step-715k-1.5T	1.5T	53.68	35.20	58.33	29.18	51.89	59.08	71.65	51.29
TinyLlama-1.1B-intermediate-step-955k-2T	2T	54.63	33.40	56.83	28.07	54.67	63.21	70.67	51.64
TinyLlama-1.1B-intermediate-step-1195k-token-2.5T	2.5T	58.96	34.40	58.72	31.91	56.78	63.21	73.07	53.86