llama2_xs_460M_experimentalオープンソースモデル - 小パラメータの大規模言語モデルの無料デプロイ

ホーム

Llama2 Xs 460M Experimental

ahxtによって開発

このシリーズのリポジトリではMeta AIのLLaMAとLLaMA 2大規模言語モデルを再現していますが、モデル規模は大幅に縮小されており、llama1_s実験版は18億パラメータ、llama2_xs実験版はわずか4.6億パラメータです。

大規模言語モデル

Transformers

英語#小規模LLaMA再現 #RedPajamaトレーニング #GPT2トークナイザー

ダウンロード数 145

リリース時間 : 7/26/2023

モデル概要

LLaMa軽量版はLLaMAとLLaMA 2の縮小規模実験バージョンで、より軽量な大規模言語モデルの選択肢を提供し、研究用途に適しています。

モデル特徴

軽量アーキテクチャ

オリジナルのLLaMAモデルの規模を大幅に縮小し、より効率的な推論能力を提供

オープンソース再現

Meta AIのLLaMAとLLaMA 2アーキテクチャを完全に再現

研究向け設計

研究目的に特化して設計されており、学術実験やモデル分析が容易

モデル能力

英語テキスト生成

質問応答タスク処理

知識推論

使用事例

学術研究

言語モデル圧縮研究

大規模言語モデルの圧縮と効率最適化の研究

4.6億パラメータの軽量モデルを実現

教育応用

質問応答システム

軽量な質問応答システムの構築

MMLUタスクで26.39の5サンプル精度を達成

🚀 LLaMa Lite: LLaMAとLLaMa 2の縮小規模実験バージョン

このリポジトリシリーズでは、Meta AIのLLaMAとLLaMa 2という大規模言語モデルのオープンソースな再現版を提供しています。ただし、モデルサイズを大幅に縮小しており、llama1_sの実験バージョンは18億個のパラメータを持ち、llama2_xsの実験バージョンは4億6000万個のパラメータを持っています。（'s'はsmallを、'xs'はextra smallを表します）

🚀 クイックスタート

このセクションでは、LLaMa Liteの基本的な使い方を説明します。

✨ 主な機能

Meta AIのLLaMAとLLaMa 2の縮小規模実験バージョンを提供
HuggingFace Transformersライブラリで直接ロード可能

📦 インストール

このリポジトリでは特別なインストール手順は必要ありません。実験用のチェックポイントはTransformersライブラリで直接ロードできます。

💻 使用例

基本的な使用法

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

# model_path = 'ahxt/llama2_xs_460M_experimental'
model_path = 'ahxt/llama1_s_1.8B_experimental'

model = AutoModelForCausalLM.from_pretrained(model_path)
tokenizer = AutoTokenizer.from_pretrained(model_path)
model.eval()

prompt = 'Q: What is the largest bird?\nA:'
input_ids = tokenizer(prompt, return_tensors="pt").input_ids
tokens = model.generate(input_ids, max_length=20)
print( tokenizer.decode(tokens[0].tolist(), skip_special_tokens=True) )
# Q: What is the largest bird?\nA: The largest bird is the bald eagle.

📚 詳細ドキュメント

データセットとトークン化

モデルはRedPajamaデータセットの一部を使って学習されています。テキストのトークン化にはGPT2Tokenizerを使用しています。

評価

モデルはMMLUタスクで評価されています。

モデル	#パラメータ	ゼロショット	5ショット
llama	7B	28.46	35.05
openllama	3B	24.90	26.71
TinyLlama-1.1B-step-50K-105b	1.1B	19.00	26.53
llama2_xs_460M	0.46B	21.13	26.39

Open LLM Leaderboard評価結果

詳細な結果はこちらで確認できます。

指標	値
平均	26.65
ARC (25ショット)	24.91
HellaSwag (10ショット)	38.47
MMLU (5ショット)	26.17
TruthfulQA (0ショット)	41.59
Winogrande (5ショット)	49.88
GSM8K (5ショット)	0.0
DROP (3ショット)	5.51