llama2_xs_460M_experimental開源模型 - 小參數大語言模型免費部署

首頁

Llama2 Xs 460M Experimental

由ahxt開發

本系列倉庫開源復現了Meta AI的LLaMA和LLaMA 2大語言模型，但模型規模顯著縮小，其中llama1_s實驗版含18億參數，llama2_xs實驗版僅含4.6億參數。

大型語言模型

Transformers

英語#小規模LLaMA復現 #RedPajama訓練 #GPT2分詞器

下載量 145

發布時間 : 7/26/2023

模型概述

LLaMa精簡版是LLaMA和LLaMA 2的縮小規模實驗版本，旨在提供更輕量級的大語言模型選擇，適用於研究用途。

模型特點

輕量級架構

顯著縮小了原始LLaMA模型的規模，提供更高效的推理能力

開源復現

完全復現了Meta AI的LLaMA和LLaMA 2架構

研究友好

專門為研究目的設計，便於學術實驗和模型分析

模型能力

英文文本生成

問答任務處理

知識推理

使用案例

學術研究

語言模型壓縮研究

研究大規模語言模型的壓縮和效率優化

實現了4.6億參數的輕量級模型

教育應用

問答系統

構建輕量級問答系統

在MMLU任務上達到26.39的五樣本準確率

🚀 LLaMa Lite：LLaMA和LLaMa 2的縮減規模實驗版本

本系列倉庫開源復現了Meta AI的LLaMA和LLaMa 2大語言模型。不過，模型規模大幅縮減，llama1_s實驗版本有18億參數，llama2_xs實驗版本有4.6億參數（'s'代表小，'xs'代表極小）。

✨ 主要特性

提供LLaMA和LLaMa 2的縮減規模實驗版本。
可直接使用HuggingFace Transformers庫加載實驗模型。

📦 安裝指南

文檔未提及安裝步驟，可參考HuggingFace Transformers庫的安裝方法來使用本實驗模型。

💻 使用示例

基礎用法

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

# model_path = 'ahxt/llama2_xs_460M_experimental'
model_path = 'ahxt/llama1_s_1.8B_experimental'

model = AutoModelForCausalLM.from_pretrained(model_path)
tokenizer = AutoTokenizer.from_pretrained(model_path)
model.eval()

prompt = 'Q: What is the largest bird?\nA:'
input_ids = tokenizer(prompt, return_tensors="pt").input_ids
tokens = model.generate(input_ids, max_length=20)
print( tokenizer.decode(tokens[0].tolist(), skip_special_tokens=True) )
# Q: What is the largest bird?\nA: The largest bird is the bald eagle.

📚 詳細文檔

數據集與分詞

我們在部分RedPajama數據集上訓練模型，使用GPT2Tokenizer對文本進行分詞。

使用HuggingFace Transformers庫

實驗模型的檢查點可直接通過Transformers庫加載。上述代碼片段展示瞭如何加載實驗模型並生成文本。

評估

我們在MMLU任務上對模型進行評估，結果如下：

模型	參數數量	零樣本	5樣本
llama	70億	28.46	35.05
openllama	30億	24.90	26.71
TinyLlama - 1.1B - step - 50K - 105b	11億	19.00	26.53
llama2_xs_460M	4600萬	21.13	26.39

Open LLM Leaderboard評估結果

詳細結果可查看此處

指標	值
平均值	26.65
ARC (25樣本)	24.91
HellaSwag (10樣本)	38.47
MMLU (5樣本)	26.17
TruthfulQA (0樣本)	41.59
Winogrande (5樣本)	49.88
GSM8K (5樣本)	0.0
DROP (3樣本)	5.51