TinyLlamaが無料でオープンソース！11億のパラメータを持つモデルがコンパクトで効率的なテキスト生成能力を提供

ホーム

Tinyllama 1.1B Intermediate Step 1431k 3T

TinyLlamaによって開発

TinyLlamaは1.1BパラメータのLlamaモデルで、3兆トークンを使用して事前学習されており、コンパクトで効率的なテキスト生成能力を提供します。

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #軽量級Llama #効率的な事前学習 #マルチタスクテキスト生成

ダウンロード数 25.04k

リリース時間 : 12/28/2023

モデル概要

TinyLlamaプロジェクトは、3兆トークンを使用して1.1BパラメータのLlamaモデルを事前学習することを目的としています。最適化により、16台のA100-40G GPUを使用して90日以内にトレーニングを完了できます。

モデル特徴

効率的な事前学習

3兆トークンを使用して事前学習され、最適化により90日以内にトレーニングを完了できます。

コンパクトモデル

わずか1.1Bパラメータで、計算リソースとメモリ使用量が制限されたアプリケーションに適しています。

互換性

Llama 2と同じアーキテクチャとトークナイザーを採用しており、多くのLlamaベースのオープンソースプロジェクトに即座に統合できます。

モデル能力

テキスト生成

推論タスク

質問応答システム

使用事例

自然言語処理

AI2推論チャレンジ

AI2推論チャレンジの問題を解決するために使用

標準化精度33.87

HellaSwag

HellaSwagデータセットでのテキスト生成タスクに使用

標準化精度60.31

教育

MMLU

マルチタスク言語理解評価に使用

精度26.04

🚀 TinyLlama-1.1B

TinyLlamaプロジェクトの目標は、3兆トークンで11億パラメータのLlamaモデルを事前学習することです。適切な最適化を行うことで、16台のA100-40G GPUを使用してわずか90日でこれを達成することができます🚀🚀。学習は2023年9月1日に開始されました。

🚀 クイックスタート

TinyLlamaのGitHubリポジトリはこちらです👉 https://github.com/jzhang38/TinyLlama

このモデルはLlama 2とまったく同じアーキテクチャとトークナイザーを採用しています。これは、TinyLlamaがLlamaをベースに構築された多くのオープンソースプロジェクトでそのまま使用できることを意味します。さらに、TinyLlamaはわずか11億のパラメータでコンパクトです。このコンパクトさにより、計算とメモリ使用量が制限された多くのアプリケーションに対応することができます。

✨ 主な機能

事前学習目標: 3兆トークンで11億パラメータのLlamaモデルを事前学習。
互換性: Llama 2と同じアーキテクチャとトークナイザーを採用し、Llamaベースのオープンソースプロジェクトでの使用が容易。
コンパクト性: 11億のパラメータで、計算とメモリ使用量の制限されたアプリケーションに適しています。

📚 ドキュメント

このコレクション

このコレクションには、1兆トークン修正後のすべてのチェックポイントが含まれています。ブランチ名はステップと見られたトークン数を示しています。

評価結果

評価指標一覧

モデル	事前学習トークン	HellaSwag	Obqa	WinoGrande	ARC_c	ARC_e	boolq	piqa	平均
Pythia-1.0B	300B	47.16	31.40	53.43	27.05	48.99	60.83	69.21	48.30
TinyLlama-1.1B-intermediate-step-50K-104b	103B	43.50	29.80	53.28	24.32	44.91	59.66	67.30	46.11
TinyLlama-1.1B-intermediate-step-240k-503b	503B	49.56	31.40	55.80	26.54	48.32	56.91	69.42	48.28
TinyLlama-1.1B-intermediate-step-480k-1007B	1007B	52.54	33.40	55.96	27.82	52.36	59.54	69.91	50.22
TinyLlama-1.1B-intermediate-step-715k-1.5T	1.5T	53.68	35.20	58.33	29.18	51.89	59.08	71.65	51.29
TinyLlama-1.1B-intermediate-step-955k-2T	2T	54.63	33.40	56.83	28.07	54.67	63.21	70.67	51.64
TinyLlama-1.1B-intermediate-step-1195k-2.5T	2.5T	58.96	34.40	58.72	31.91	56.78	63.21	73.07	53.86
TinyLlama-1.1B-intermediate-step-1431k-3T	3T	59.20	36.00	59.12	30.12	55.25	57.83	73.29	52.99

Open LLM Leaderboardの評価結果

詳細な結果はこちらで確認できます。

評価指標	値
平均	36.42
AI2 Reasoning Challenge (25-Shot)	33.87
HellaSwag (10-Shot)	60.31
MMLU (5-Shot)	26.04
TruthfulQA (0-shot)	37.32
Winogrande (5-shot)	59.51
GSM8k (5-shot)	1.44