llama-65b-instruct開源大語言模型 - 免費部署處理長文本能力強

首頁

Llama 65b Instruct

由upstage開發

由Upstage基於LLaMA架構開發的65B參數指令微調大語言模型，支持長文本處理

大型語言模型

Transformers

英語#超長文本處理 #指令微調優化 #英語對話系統

下載量 144

發布時間 : 7/17/2023

模型概述

這是一個65B參數規模的指令微調大語言模型，基於Meta的LLaMA架構開發，專門優化了遵循指令和長文本處理能力。

模型特點

長文本處理能力

通過rope_scaling技術支持超過10k標記的上下文長度

指令優化

使用Orca風格數據集進行微調，優化了遵循指令的能力

高效推理

支持8-bit量化加載，降低硬件需求

模型能力

文本生成

指令跟隨

長文本理解

問答系統

使用案例

智能助手

多輪對話系統

構建能理解長對話上下文的智能助手

知識問答

複雜問題解答

處理需要長上下文理解的複雜問題

🚀 LLaMa-65b-instruct 模型卡片

本模型基於LLaMA架構開發，可處理長輸入序列，在多個基準測試中表現良好，適用於文本生成任務。

🚀 快速開始

本模型已在A100 80GB上進行測試，藉助rope_scaling選項，能夠處理多達10k以上的輸入令牌。

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer

tokenizer = AutoTokenizer.from_pretrained("upstage/llama-65b-instruct")
model = AutoModelForCausalLM.from_pretrained(
    "upstage/llama-65b-instruct",
    device_map="auto",
    torch_dtype=torch.float16,
    load_in_8bit=True,
    rope_scaling={"type": "dynamic", "factor": 2} # 允許處理更長的輸入
)

prompt = "### User:\nThomas is healthy, but he has to go to the hospital. What could be the reasons?\n\n### Assistant:\n"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
del inputs["token_type_ids"]
streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)

output = model.generate(**inputs, streamer=streamer, use_cache=True, max_new_tokens=float('inf'))
output_text = tokenizer.decode(output[0], skip_special_tokens=True)

✨ 主要特性

具有不同的模型參數大小和序列長度，提供多種選擇。
能夠處理多達10k以上的輸入令牌，適應長文本輸入。
在多個基準測試中表現良好，具有較高的性能。

📦 安裝指南

文檔未提及安裝步驟，暫不提供。

💻 使用示例

基礎用法

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer

tokenizer = AutoTokenizer.from_pretrained("upstage/llama-65b-instruct")
model = AutoModelForCausalLM.from_pretrained(
    "upstage/llama-65b-instruct",
    device_map="auto",
    torch_dtype=torch.float16,
    load_in_8bit=True,
    rope_scaling={"type": "dynamic", "factor": 2} # 允許處理更長的輸入
)

prompt = "### User:\nThomas is healthy, but he has to go to the hospital. What could be the reasons?\n\n### Assistant:\n"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
del inputs["token_type_ids"]
streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)

output = model.generate(**inputs, streamer=streamer, use_cache=True, max_new_tokens=float('inf'))
output_text = tokenizer.decode(output[0], skip_special_tokens=True)

📚 詳細文檔

模型詳情

屬性	詳情
開發者	Upstage
骨幹模型	LLaMA
變體	具有不同的模型參數大小和序列長度：30B/1024，30B/2048，65B/1024
語言	英文
庫	HuggingFace Transformers
許可證	此模型遵循非商業定製許可證，並受Meta許可證管轄。只有在通過填寫此表單獲得模型訪問權限，但丟失了權重副本或在將其轉換為Transformers格式時遇到問題的情況下，才能使用此倉庫。
反饋地址	有關如何對模型提供反饋或評論的說明，可以在Hugging Face社區的模型倉庫中打開一個問題查看。
聯繫方式	有關模型的問題和評論，請發送電子郵件至contact@upstage.ai

數據集詳情

使用的數據集

Orca風格數據集
除上述數據集外，未使用其他數據

提示模板

### System:
{System}

### User:
{User}

### Assistant:
{Assistant}

硬件和軟件

硬件：我們使用了A100x8 * 4來訓練我們的模型。
訓練因素：我們使用DeepSpeed庫和HuggingFace Trainer的組合對該模型進行了微調。

評估結果

概述

我們基於在Open LLM排行榜上評估的任務進行了性能評估。我們在四個基準數據集上評估了我們的模型，包括ARC-Challenge、HellaSwag、MMLU和TruthfulQA。我們使用了lm-evaluation-harness倉庫，具體是提交版本b281b0921b636bc36ad05c0b0b0763bd6dd43463。
我們使用MT-bench（一組具有挑戰性的多輪開放式問題）來評估模型。

主要結果

模型	H4(平均)	ARC	HellaSwag	MMLU	TruthfulQA	MT_Bench
Llama-2-70b-instruct-v2(我們的，Open LLM排行榜)	73	71.1	87.9	70.6	62.2	7.44063
Llama-2-70b-instruct (我們的，Open LLM排行榜)	72.3	70.9	87.5	69.8	61	7.24375
llama-65b-instruct (我們的, Open LLM排行榜)	69.4	67.6	86.5	64.9	58.8
Llama-2-70b-hf	67.3	67.3	87.3	69.8	44.9
llama-30b-instruct-2048 (我們的，Open LLM排行榜)	67.0	64.9	84.9	61.9	56.3
llama-30b-instruct (我們的，Open LLM排行榜)	65.2	62.5	86.2	59.4	52.8
llama-65b	64.2	63.5	86.1	63.9	43.4
falcon-40b-instruct	63.4	61.6	84.3	55.4	52.5

H4分數復現腳本

準備評估環境：

# 克隆倉庫
git clone https://github.com/EleutherAI/lm-evaluation-harness.git

# 檢出特定提交版本
git checkout b281b0921b636bc36ad05c0b0b0763bd6dd43463

# 切換到倉庫目錄
cd lm-evaluation-harness

倫理問題

倫理考量

由於我們在模型的訓練過程中未包含基準測試集或訓練集，因此不存在倫理問題。

聯繫我們

為何選擇Upstage大語言模型？

Upstage的大語言模型研究取得了顯著成果。截至8月1日，我們的70B模型在openLLM排名中位居榜首，成為目前全球領先的模型。鑑於將私有大語言模型應用於實際業務的巨大潛力，我們邀請您輕鬆應用私有大語言模型，並使用您自己的數據進行微調。如需無縫且定製化的解決方案，請隨時與我們聯繫。► 點擊此處聯繫