Breeze-7B-Instruct-v1_0开源语言模型 - 免费部署，支持繁体中文问答与多轮对话

首页

Breeze 7B Instruct V1 0

由 MediaTek-Research 开发

Breeze-7B-Instruct是基于Mistral-7B构建的繁体中文优化语言模型，专为指令跟随任务设计，支持问答、多轮对话等场景。

大型语言模型

Transformers

支持多种语言开源协议:Apache-2.0 #繁体中文优化 #扩展词表加速 #多轮对话支持

下载量 1,388

发布时间 : 3/5/2024

模型简介

该模型是联发科研发的Breeze-7B系列中的指令微调版本，针对繁体中文应用场景优化，可直接用于常见任务如问答、检索增强生成、多轮对话和文本摘要。

模型特点

扩展词表优化

词表从32k扩展至62k，显著提升繁体中文处理效率，推理速度达到同类模型两倍

长上下文支持

支持8k token的上下文长度，适合处理长文档和复杂对话场景

多轮对话能力

专门优化多轮对话交互，支持连贯的上下文理解

模型能力

问答系统

多轮对话

文本摘要

检索增强生成

繁体中文文本生成

英文文本生成

使用案例

智能客服

繁体中文客户支持

处理台湾地区用户的客服咨询

在MT-Bench-tw对话评测中获得6.0分

教育辅助

繁体中文学习助手

帮助学生解答繁体中文相关问题

在TMMLU+知识评测中获得42.67%准确率

🚀 联发科研究Breeze-7B-Instruct-v1_0模型卡片

联发科研究的Breeze-7B是基于Mistral-7B构建的语言模型家族，专门为繁体中文使用场景设计。该模型家族在性能和实用性上表现出色，能满足多种自然语言处理任务的需求。

🚀 快速开始

若要在Transformers库中使用Breeze-7B模型，可按以下步骤操作：

首先安装直接依赖项：

pip install transformers torch accelerate

若想使用flash-attention2实现更快的推理速度，还需安装以下依赖项：

pip install packaging ninja
pip install flash-attn

然后在transformers中加载模型：

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# 指令模型
model = AutoModelForCausalLM.from_pretrained(
    "MediaTek-Research/Breeze-7B-Instruct-v1_0",
    device_map="auto",
    torch_dtype=torch.bfloat16,
    # attn_implementation="flash_attention_2" # 可选
)

# 基础模型
model = AutoModelForCausalLM.from_pretrained(
    "MediaTek-Research/Breeze-7B-Base-v1_0",
    device_map="auto",
    torch_dtype=torch.bfloat16,
    # attn_implementation="flash_attention_2" # 可选
)

对于Breeze-7B-Instruct模型，查询的结构如下：

<s>SYS_PROMPT  [INST] QUERY1 [/INST] RESPONSE1 [INST] QUERY2 [/INST]

其中，SYS_PROMPT、QUERY1、RESPONSE1和QUERY2可由用户提供。建议的默认SYS_PROMPT为：

You are a helpful AI assistant built by MediaTek Research. The user you are helping speaks Traditional Chinese and comes from Taiwan.

我们还将chat_template集成到了tokenizer_config.json中，因此可以使用apply_chat_template来获取提示：

>>> from transformers import AutoTokenizer
>>> tokenizer = AutoTokenizer.from_pretrained("MediaTek-Research/Breeze-7B-Instruct-v1_0")
>>> chat = [
...   {"role": "user", "content": "你好，請問你可以完成什麼任務？"},
...   {"role": "assistant", "content": "你好，我可以幫助您解決各種問題、提供資訊和協助您完成許多不同的任務。例如：回答技術問題、提供建議、翻譯文字、尋找資料或協助您安排行程等。請告訴我如何能幫助您。"},
...   {"role": "user", "content": "太棒了！"},
... ]
>>> tokenizer.apply_chat_template(chat, tokenize=False)
"<s>You are a helpful AI assistant built by MediaTek Research. The user you are helping speaks Traditional Chinese and comes from Taiwan.  [INST] 你好，請問你可以完成什麼任務？ [/INST] 你好，我可以幫助您解決各種問題、提供資訊和協助您完成許多不同的任務。例如：回答技術問題、提供建議、翻譯文字、尋找資料或協助您安排行程等。請告訴我如何能幫助您。 [INST] 太棒了！ [/INST] "
# 分词结果
# ['▁', '你好', '，', '請問', '你', '可以', '完成', '什麼', '任務', '？']
# ['▁', '你好', '，', '我', '可以', '幫助', '您', '解決', '各種', '問題', '、', '提供', '資訊', '和', '協助', '您', '完成', '許多', '不同', '的', '任務', '。', '例如', '：', '回答', '技術', '問題', '、', '提供', '建議', '、', '翻譯', '文字', '、', '尋找', '資料', '或', '協助', '您', '安排', '行程', '等', '。', '請', '告訴', '我', '如何', '能', '幫助', '您', '。']
# ['▁', '太', '棒', '了', '！']

文本生成可以通过generate和apply_chat_template函数完成：

>>> outputs = model.generate(tokenizer.apply_chat_template(chat, return_tensors="pt"),
>>>                          # 必要时调整以下参数
>>>                          max_new_tokens=128,
>>>                          top_p=0.01,
>>>                          top_k=85,
>>>                          repetition_penalty=1.1,
>>>                          temperature=0.01)
>>>                          
>>> print(tokenizer.decode(outputs[0]))

✨ 主要特性

Breeze-7B-Base-v1_0

词汇表大小从32k扩展到62k，更好地支持繁体中文。
具有8k的上下文长度。

Breeze-7B-Instruct-v1_0

词汇表大小从32k扩展到62k，更好地支持繁体中文。
具有8k的上下文长度。
支持多轮对话（未对有害内容进行特殊处理）。

📦 安装指南

在Transformers库中使用Breeze-7B模型的安装步骤如下：

安装直接依赖项：

pip install transformers torch accelerate

若要使用flash-attention2实现更快的推理速度，还需安装以下依赖项：

pip install packaging ninja
pip install flash-attn

💻 使用示例

基础用法

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# 指令模型
model = AutoModelForCausalLM.from_pretrained(
    "MediaTek-Research/Breeze-7B-Instruct-v1_0",
    device_map="auto",
    torch_dtype=torch.bfloat16,
    # attn_implementation="flash_attention_2" # 可选
)

# 基础模型
model = AutoModelForCausalLM.from_pretrained(
    "MediaTek-Research/Breeze-7B-Base-v1_0",
    device_map="auto",
    torch_dtype=torch.bfloat16,
    # attn_implementation="flash_attention_2" # 可选
)

高级用法

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

tokenizer = AutoTokenizer.from_pretrained("MediaTek-Research/Breeze-7B-Instruct-v1_0")
chat = [
    {"role": "user", "content": "你好，請問你可以完成什麼任務？"},
    {"role": "assistant", "content": "你好，我可以幫助您解決各種問題、提供資訊和協助您完成許多不同的任務。例如：回答技術問題、提供建議、翻譯文字、尋找資料或協助您安排行程等。請告訴我如何能幫助您。"},
    {"role": "user", "content": "太棒了！"},
]

outputs = model.generate(tokenizer.apply_chat_template(chat, return_tensors="pt"),
                         # 必要时调整以下参数
                         max_new_tokens=128,
                         top_p=0.01,
                         top_k=85,
                         repetition_penalty=1.1,
                         temperature=0.01)

print(tokenizer.decode(outputs[0]))

📚 详细文档

模型详情

Breeze-7B-Base-v1_0
- 微调自：mistralai/Mistral-7B-v0.1
- 模型类型：因果解码器型Transformer语言模型
- 支持语言：英语和繁体中文（zh-tw）
Breeze-7B-Instruct-v1_0
- 微调自：MediaTek-Research/Breeze-7B-Base-v1_0
- 模型类型：因果解码器型Transformer语言模型
- 支持语言：英语和繁体中文（zh-tw）

模型性能

基础模型性能

我们将Breeze-7B-Base-v1_0与其他在中文任务上表现出色的同规模开源基础语言模型进行了比较。评估指标包括TMMLU+、DRCD、Table和MMLU。具体结果如下：

模型	参数数量	↑ TMMLU+ (ACC)	DRCD (EM)	Table (ACC)	MMLU (ACC)
		繁体中文，知识	繁体中文，推理	繁体中文，推理	英文，知识
		5 shot	3 shot	5 shot	5 shot
Yi-6B	6B	49.63	76.61	34.72	65.35
Qwen1.5-7B	7B	46.59	74.41	30.56	63.07
Breeze-7B-Base-v1_0	7B	42.67	80.61	31.99	61.24
Mistral-7B-v0.1	7B	36.93	79.27	27.78	64.89

指令微调模型性能

我们将Breeze-7B-Instruct-v1_0与其他同规模的开源指令微调语言模型进行了比较，并列出了GPT-3.5 Turbo (1106)的基准分数作为参考。评估指标包括MT-Bench-tw、TMMLU+、Table、MT-Bench和MMLU。具体结果如下：

模型	参数数量	↑ MT-Bench-tw (Score)	TMMLU+ (ACC)	Table (ACC)	MT-Bench (Score)	MMLU (ACC)
		繁体中文，对话	繁体中文，知识	繁体中文，推理	英文，对话	英文，知识
		0 shot	0 shot	0 shot	0 shot	0 shot
GPT-3.5-Turbo		7.1	43.56	45.14	7.9	67.09
Qwen1.5-7B-Chat	7B	6.4	45.65	34.72	7.6	61.85
Breeze-7B-Instruct-v1_0	7B	6.0	42.67	39.58	7.4	61.73
Mistral-7B-v0.2-Instruct	7B	5.6	34.95	33.33	7.6	59.97
Yi-6B-Chat	6B	5.0	44.79	25.69	6.0	59.45
Taiwan-LLM-13B-v2.0-chat	13B	5.0	29.47	23.61	N/A*	50.50
Taiwan-LLM-7B-v2.1-chat	7B	4.2	28.08	31.25	N/A*	42.72

注：*Taiwan-LLM模型以繁体中文回答多轮英文问题。

MT-Bench-tw (0 shot)详情

模型	STEM	提取	推理	数学	编码	角色扮演	写作	人文	平均
GPT-3.5-Turbo	7.8	6.1	5.1	6.4	6.2	8.7	7.4	9.3	7.1
Qwen1.5-7B-Chat	9	5.6	4.7	2.8	3.7	8.0	8.0	9.4	6.4
Breeze-7B-Instruct-v1_0	7.8	5.2	4.2	4.2	4.1	7.6	5.9	9.1	6.0
Mistral-7B-v0.2-Instruct	6.9	4.6	4.3	3.3	4.4	7.2	6.2	7.8	5.6
Yi-6B-Chat	7.3	2.7	3.1	3.3	2.3	7.2	5.2	8.8	5.0
Taiwan-LLM-13B-v2.0-chat	6.1	3.4	4.1	2.3	3.1	7.4	6.6	6.8	5.0
Taiwan-LLM-7B-v2.1-chat	5.2	2.6	2.3	1.2	3.4	6.6	5.7	6.8	4.2

TMMLU+ (0 shot)详情

模型	STEM	社会科学	人文	其他	平均
GPT-3.5-Turbo	41.58	48.52	40.96	43.18	43.56
Qwen1.5-7B-Chat	41.48	51.66	44.05	45.40	45.65
Breeze-7B-Instruct-v1_0	36.46	48.38	45.11	40.75	42.67
Mistral-7B-v0.2-Instruct	32.79	38.05	34.89	34.04	34.94
Yi-6B-Chat	37.80	51.74	45.36	44.25	44.79
Taiwan-LLM-13B-v2.0-chat	27.74	33.69	27.03	29.43	29.47
Taiwan-LLM-7B-v2.1-chat	25.58	31.76	27.36	27.61	28.08

推理性能

在推理性能测试中，我们使用这篇网络文章的前700个字符作为输入，要求模型重新生成相同的文章。所有推理均在2块RTX A6000 GPU上运行（使用vllm，张量并行大小为2）。具体结果如下：

模型	↓ 推理时间 (秒)	估计最大输入长度 (字符)
Qwen1.5-7B-Chat	9.35	38.9k
Yi-6B-Chat	10.62	5.2k
Breeze-7B-Instruct-v1_0	10.74	11.1k
Mistral-7B-Instruct-v0.2	20.48	5.1k
Taiwan-LLM-7B-v2.1-chat	26.26	2.2k

演示

点击此处试用模型演示👩‍💻🧑🏻‍💻。

🔧 技术细节

评估数据集

TMMLU+、DRCD、Table来源：MediaTek-Research/TCEval-v2，该数据集源自TCEval-v1和ikala/tmmluplus。
MMLU来源：hails/mmlu_no_train。

评估代码

我们使用从EleutherAI/lm-evaluation-harness修改而来的代码来评估TMMLU+、DRCD、Table和MMLU。所有选择题均采用对数似然选择。对于MT-Bench-tw和MT-Bench，我们使用从fastchat llm_judge修改而来的代码（使用GPT4作为评判）进行评估。

📄 许可证

本项目采用Apache 2.0许可证。

引用

@article{MediaTek-Research2024breeze7b,
      title={Breeze-7B Technical Report}, 
      author={Chan-Jan Hsu and Chang-Le Liu and Feng-Ting Liao and Po-Chun Hsu and Yi-Chang Chen and Da-Shan Shiu},
      year={2024},
      eprint={2403.02712},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

本项目由以下成员（按姓氏字母顺序排列）完成：Chan-Jan Hsu 許湛然、Chang-Le Liu 劉昶樂、Feng-Ting Liao 廖峰挺、Po-Chun Hsu 許博竣、Yi-Chang Chen 陳宜昌，指导老师为Da-Shan Shiu 許大山。