Yi-6B、Yi-34B-Chat开源双语大模型 - 免费部署，性能直追GPT-4 Turbo

首页

Yi 6B

由 01-ai 开发

Yi-34B-Chat是由01.AI开发的双语大语言模型，在AlpacaEval排行榜上仅次于GPT-4 Turbo，表现优异。

大型语言模型

Transformers

开源协议:Apache-2.0 #双语对话 #长文本处理 #高性能推理

下载量 17.03k

发布时间 : 11/1/2023

模型简介

Yi-34B-Chat是基于Yi-34B基础模型优化的对话模型，擅长语言理解、常识推理和阅读理解等任务。

模型特点

双语能力

在3T多语言语料库上训练，具备出色的中英双语处理能力

强大性能

在AlpacaEval排行榜上排名第二，超越GPT-4、Mixtral等模型

长文本处理

支持200K上下文长度，在'大海捞针'测试中达到99.8%准确率

模型能力

文本生成

对话交互

常识推理

阅读理解

指令跟随

使用案例

智能助手

日常问答

回答用户各种日常问题

示例输出：'你好！今天有什么可以帮您的吗？'

创意写作

故事生成

根据提示生成创意故事

示例输出包含丰富的想象力和连贯的情节

🚀 易模型（Yi）

易（Yi）系列模型是由 01.AI 从头开始训练的下一代开源大语言模型。该系列模型以双语语言模型为目标，在 3T 多语言语料上进行训练，成为全球最强大的大语言模型之一，在语言理解、常识推理、阅读理解等方面表现出色。

🚀 快速开始

💡 提示：如果您想开始使用易模型并探索不同的推理方法，请查看易模型使用指南。

选择使用方式

选择以下其中一种方式开启您的易模型之旅！

快速开始 - 选择您的路径

🎯 本地部署易模型

如果您想在本地部署易模型：

🙋‍♀️ 若您有充足的资源（例如，NVIDIA A800 80GB），可以选择以下方法之一：
🙋‍♀️ 若您的资源有限（例如，MacBook Pro），可以使用 llama.cpp。

🎯 非本地部署易模型

如果您不想在本地部署易模型，可以通过以下任意选项探索易模型的能力。

🙋‍♀️ 使用 API 运行易模型

如果您想探索易模型的更多功能，可以采用以下方法之一：

易模型 API（官方）
- 部分申请者已获得早期访问权限。请关注下一轮访问机会！
易模型 API（Replicate）

🙋‍♀️ 在 playground 中运行易模型

如果您想以更多可定制选项（例如，系统提示、温度、重复惩罚等）与易模型聊天，可以尝试以下选项之一：

易 - 34B - 聊天 - 游乐场（官方）
- 通过白名单访问。欢迎申请（填写英文或中文表格）。
易 - 34B - 聊天 - 游乐场（Replicate）

✨ 主要特性

🤖 易系列模型是由 01.AI 从头开始训练的下一代开源大语言模型。
🙌 以双语语言模型为目标，在 3T 多语言语料上进行训练，成为全球最强大的大语言模型之一，在语言理解、常识推理、阅读理解等方面表现出色。例如：
- 易 - 34B - 聊天模型在 AlpacaEval 排行榜上 位居第二（仅次于 GPT - 4 Turbo），超越了其他大语言模型（如 GPT - 4、Mixtral、Claude）（基于截至 2024 年 1 月的数据）。
- 易 - 34B 模型在包括 Hugging Face 开源大语言模型排行榜（预训练）和 C - Eval 在内的各种基准测试中，在 英语和中文方面 均 在所有现有开源模型中排名第一（如 Falcon - 180B、Llama - 70B、Claude）（基于截至 2023 年 11 月的数据）。
- 🙏（感谢 Llama）感谢 Transformer 和 Llama 开源社区，它们减少了从头构建的工作量，并使我们能够在人工智能生态系统中使用相同的工具。

如果您对易模型采用 Llama 架构和许可证使用政策感兴趣，请查看易模型与 Llama 的关系 ⬇️

💡 简而言之

易系列模型采用了与 Llama 相同的模型架构，但并非 Llama 的衍生模型。

易模型和 Llama 均基于 Transformer 结构，自 2018 年以来，Transformer 一直是大语言模型的标准架构。
基于 Transformer 架构，Llama 因其出色的稳定性、可靠的收敛性和强大的兼容性，已成为大多数最先进开源模型的新基石。这使得 Llama 成为包括易模型在内的模型公认的基础框架。
由于 Transformer 和 Llama 架构，其他模型可以利用它们的优势，减少从头构建的工作量，并在其生态系统中使用相同的工具。
然而，易系列模型并非 Llama 的衍生模型，因为它们没有使用 Llama 的权重。
- 由于大多数开源模型都采用了 Llama 的结构，决定模型性能的关键因素是训练数据集、训练管道和训练基础设施。
- 易模型以独特的专有方式发展，完全从头开始独立创建了自己的高质量训练数据集、高效的训练管道和强大的训练基础设施。这一努力使得易系列模型表现出色，在 2023 年 12 月的 Alpaca 排行榜上仅次于 GPT4 并超越了 Llama。

📦 安装指南

pip 安装

暂未提及具体 pip 安装命令，可参考易模型使用指南进行安装。

Docker 部署

暂未提及具体 Docker 部署命令，可参考易模型使用指南进行部署。

conda-lock 安装

暂未提及具体 conda - lock 安装命令，可参考易模型使用指南进行安装。

llama.cpp 安装

暂未提及具体 llama.cpp 安装命令，可参考易模型使用指南进行安装。

💻 使用示例

基础用法

以下是使用易模型 API 的示例代码：

# 示例代码，假设使用 Replicate 的 API
import replicate

model = replicate.models.get("01-ai/yi-34b-chat")
version = model.versions.get("your_version_number")

input = {
    "prompt": "Hello!",
    "temperature": 0.7,
    "max_length": 200
}

output = version.predict(**input)
print(output)

高级用法

# 高级用法示例，使用系统提示和更多参数
import replicate

model = replicate.models.get("01-ai/yi-34b-chat")
version = model.versions.get("your_version_number")

input = {
    "prompt": "Hello!",
    "system_prompt": "You are a helpful assistant.",
    "temperature": 0.7,
    "max_length": 200,
    "repetition_penalty": 1.2
}

output = version.predict(**input)
print(output)

📚 详细文档

模型介绍

易模型有多种尺寸，适用于不同的用例。您还可以对易模型进行微调以满足您的特定需求。

如果您想部署易模型，请确保满足软件和硬件要求。

聊天模型

模型	下载地址
易 - 34B - 聊天	• 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel
易 - 34B - 聊天 - 4bits	• 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel
易 - 34B - 聊天 - 8bits	• 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel
易 - 6B - 聊天	• 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel
易 - 6B - 聊天 - 4bits	• 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel
易 - 6B - 聊天 - 8bits	• 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel

_{^{- 4 - bit 系列模型由 AWQ 量化。
- 8 - bit 系列模型由 GPTQ 量化
- 所有量化模型的使用门槛较低，因为它们可以部署在消费级 GPU 上（例如，3090、4090）。}}

基础模型

模型	下载地址
易 - 34B	• 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel
易 - 34B - 200K	• 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel
易 - 9B	• 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel
易 - 9B - 200K	• 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel
易 - 6B	• 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel
易 - 6B - 200K	• 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel

_{^{- 200k 大约相当于 400,000 个中文字符。
- 如果您想使用易 - 34B - 200K 的先前版本（2023 年 11 月 5 日发布），请运行 git checkout 069cd341d60f4ce4b07ec394e82b79e94f656cf 下载权重。}}

模型信息

聊天模型和基础模型

模型	介绍	默认上下文窗口	预训练令牌	训练数据日期
6B 系列模型	适用于个人和学术用途。	4K	3T	截至 2023 年 6 月
9B 系列模型	在易系列模型中，它在编码和数学方面表现最佳。	4K	易 - 9B 基于易 - 6B 持续训练，使用 0.8T 令牌。	截至 2023 年 6 月
34B 系列模型	适用于个人、学术和商业（特别是中小企业）用途。这是一种经济高效的解决方案，价格实惠且具备涌现能力。	4K	3T	截至 2023 年 6 月

聊天模型

关于聊天模型的局限性，请查看以下解释 ⬇️

<br> 然而，这种更高的多样性可能会放大某些现有问题，包括：
  <li> 幻觉：这是指模型生成事实错误或无意义的信息。由于模型的响应更加多样化，出现基于不准确数据或逻辑推理的幻觉的可能性更高。</li>
  <li> 重新生成的非确定性：在尝试重新生成或采样响应时，可能会出现结果不一致的情况。增加的多样性可能导致即使在相似的输入条件下也会产生不同的结果。</li>
  <li> 累积误差：当模型响应中的误差随着时间累积时就会出现这种情况。随着模型生成的响应更加多样化，小的不准确累积成大误差的可能性增加，特别是在复杂任务中，如扩展推理、数学问题解决等。</li>
  <li> 为了获得更连贯和一致的响应，建议调整生成配置参数，如温度、top_p 或 top_k。这些调整可以帮助平衡模型输出的创造性和连贯性。</li>