llama-65b-instruct开源大语言模型 - 免费部署处理长文本能力强

首页

Llama 65b Instruct

由 upstage 开发

由Upstage基于LLaMA架构开发的65B参数指令微调大语言模型，支持长文本处理

大型语言模型

Transformers

英语#超长文本处理 #指令微调优化 #英语对话系统

下载量 144

发布时间 : 7/17/2023

模型简介

这是一个65B参数规模的指令微调大语言模型，基于Meta的LLaMA架构开发，专门优化了遵循指令和长文本处理能力。

模型特点

长文本处理能力

通过rope_scaling技术支持超过10k标记的上下文长度

指令优化

使用Orca风格数据集进行微调，优化了遵循指令的能力

高效推理

支持8-bit量化加载，降低硬件需求

模型能力

文本生成

指令跟随

长文本理解

问答系统

使用案例

智能助手

多轮对话系统

构建能理解长对话上下文的智能助手

知识问答

复杂问题解答

处理需要长上下文理解的复杂问题

🚀 LLaMa-65b-instruct 模型卡片

本模型基于LLaMA架构开发，可处理长输入序列，在多个基准测试中表现良好，适用于文本生成任务。

🚀 快速开始

本模型已在A100 80GB上进行测试，借助rope_scaling选项，能够处理多达10k以上的输入令牌。

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer

tokenizer = AutoTokenizer.from_pretrained("upstage/llama-65b-instruct")
model = AutoModelForCausalLM.from_pretrained(
    "upstage/llama-65b-instruct",
    device_map="auto",
    torch_dtype=torch.float16,
    load_in_8bit=True,
    rope_scaling={"type": "dynamic", "factor": 2} # 允许处理更长的输入
)

prompt = "### User:\nThomas is healthy, but he has to go to the hospital. What could be the reasons?\n\n### Assistant:\n"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
del inputs["token_type_ids"]
streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)

output = model.generate(**inputs, streamer=streamer, use_cache=True, max_new_tokens=float('inf'))
output_text = tokenizer.decode(output[0], skip_special_tokens=True)

✨ 主要特性

具有不同的模型参数大小和序列长度，提供多种选择。
能够处理多达10k以上的输入令牌，适应长文本输入。
在多个基准测试中表现良好，具有较高的性能。

📦 安装指南

文档未提及安装步骤，暂不提供。

💻 使用示例

基础用法

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer

tokenizer = AutoTokenizer.from_pretrained("upstage/llama-65b-instruct")
model = AutoModelForCausalLM.from_pretrained(
    "upstage/llama-65b-instruct",
    device_map="auto",
    torch_dtype=torch.float16,
    load_in_8bit=True,
    rope_scaling={"type": "dynamic", "factor": 2} # 允许处理更长的输入
)

prompt = "### User:\nThomas is healthy, but he has to go to the hospital. What could be the reasons?\n\n### Assistant:\n"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
del inputs["token_type_ids"]
streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)

output = model.generate(**inputs, streamer=streamer, use_cache=True, max_new_tokens=float('inf'))
output_text = tokenizer.decode(output[0], skip_special_tokens=True)

📚 详细文档

模型详情

属性	详情
开发者	Upstage
骨干模型	LLaMA
变体	具有不同的模型参数大小和序列长度：30B/1024，30B/2048，65B/1024
语言	英文
库	HuggingFace Transformers
许可证	此模型遵循非商业定制许可证，并受Meta许可证管辖。只有在通过填写此表单获得模型访问权限，但丢失了权重副本或在将其转换为Transformers格式时遇到问题的情况下，才能使用此仓库。
反馈地址	有关如何对模型提供反馈或评论的说明，可以在Hugging Face社区的模型仓库中打开一个问题查看。
联系方式	有关模型的问题和评论，请发送电子邮件至contact@upstage.ai

数据集详情

使用的数据集

Orca风格数据集
除上述数据集外，未使用其他数据

提示模板

### System:
{System}

### User:
{User}

### Assistant:
{Assistant}

硬件和软件

硬件：我们使用了A100x8 * 4来训练我们的模型。
训练因素：我们使用DeepSpeed库和HuggingFace Trainer的组合对该模型进行了微调。

评估结果

概述

我们基于在Open LLM排行榜上评估的任务进行了性能评估。我们在四个基准数据集上评估了我们的模型，包括ARC-Challenge、HellaSwag、MMLU和TruthfulQA。我们使用了lm-evaluation-harness仓库，具体是提交版本b281b0921b636bc36ad05c0b0b0763bd6dd43463。
我们使用MT-bench（一组具有挑战性的多轮开放式问题）来评估模型。

主要结果

模型	H4(平均)	ARC	HellaSwag	MMLU	TruthfulQA	MT_Bench
Llama-2-70b-instruct-v2(我们的，Open LLM排行榜)	73	71.1	87.9	70.6	62.2	7.44063
Llama-2-70b-instruct (我们的，Open LLM排行榜)	72.3	70.9	87.5	69.8	61	7.24375
llama-65b-instruct (我们的, Open LLM排行榜)	69.4	67.6	86.5	64.9	58.8
Llama-2-70b-hf	67.3	67.3	87.3	69.8	44.9
llama-30b-instruct-2048 (我们的，Open LLM排行榜)	67.0	64.9	84.9	61.9	56.3
llama-30b-instruct (我们的，Open LLM排行榜)	65.2	62.5	86.2	59.4	52.8
llama-65b	64.2	63.5	86.1	63.9	43.4
falcon-40b-instruct	63.4	61.6	84.3	55.4	52.5

H4分数复现脚本

准备评估环境：

# 克隆仓库
git clone https://github.com/EleutherAI/lm-evaluation-harness.git

# 检出特定提交版本
git checkout b281b0921b636bc36ad05c0b0b0763bd6dd43463

# 切换到仓库目录
cd lm-evaluation-harness

伦理问题

伦理考量

由于我们在模型的训练过程中未包含基准测试集或训练集，因此不存在伦理问题。

联系我们

为何选择Upstage大语言模型？

Upstage的大语言模型研究取得了显著成果。截至8月1日，我们的70B模型在openLLM排名中位居榜首，成为目前全球领先的模型。鉴于将私有大语言模型应用于实际业务的巨大潜力，我们邀请您轻松应用私有大语言模型，并使用您自己的数据进行微调。如需无缝且定制化的解决方案，请随时与我们联系。► 点击此处联系