Pythia-Chat-Base-7B开源对话模型 - 70亿参数，超4000万指令训练

首页

Pythia Chat Base 7B

由 togethercomputer 开发

基于EleutherAI Pythia-7B微调的70亿参数开源对话模型，使用100%负碳计算资源训练超过4000万条指令

大型语言模型

Transformers

英语开源协议:Apache-2.0 #低显存对话模型 #指令微调优化 #多任务对话

下载量 194

发布时间 : 3/22/2023

模型简介

专注于对话式交互的英语语言模型，优化了问答、分类、信息提取和摘要生成等任务

模型特点

低显存需求

通过量化技术可在12GB显存的GPU上运行推理

环保计算

使用100%负碳计算资源训练

大规模指令微调

在4300万条高质量指令数据集上进行微调

人类偏好优化

通过少量反馈数据进一步优化以适应人类对话偏好

模型能力

上下文问答

文本分类

信息提取

文本摘要

对话生成

小样本学习

使用案例

研究领域

对话模型安全研究

研究潜在有害内容生成模型的安全部署

模型局限性研究

探究对话模型/语言模型的局限性与偏见

应用开发

教育工具开发

开发教育或创意工具应用

艺术创作辅助

作为艺术创作与设计辅助工具

🚀 Pythia-Chat-Base-7B-v0.16

Pythia-Chat-Base-7B-v0.16是一个基于70亿参数的开源聊天模型。它基于EleutherAI的Pythia 7B模型微调而来，在100%负碳排放的计算资源上使用超过4000万条指令进行训练。该模型能够在12GB的GPU上进行推理，具有广泛的应用场景。

欢迎试用我们的 OpenChatKit反馈应用！

🚀 快速开始

GPU推理

此方法需要一个具有24GB内存的GPU。

from transformers import AutoTokenizer, AutoModelForCausalLM

# 初始化
tokenizer = AutoTokenizer.from_pretrained("togethercomputer/Pythia-Chat-Base-7B-v0.16")
model = AutoModelForCausalLM.from_pretrained("togethercomputer/Pythia-Chat-Base-7B-v0.16", torch_dtype=torch.float16)
model = model.to('cuda:0')

# 推理
inputs = tokenizer("<human>: Hello!\n<bot>:", return_tensors='pt').to(model.device)
outputs = model.generate(**inputs, max_new_tokens=10, do_sample=True, temperature=0.8)
output_str = tokenizer.decode(outputs[0])
print(output_str)

Int8格式的GPU推理

此方法需要一个具有12GB内存的GPU。

from transformers import AutoTokenizer, AutoModelForCausalLM

# 初始化
tokenizer = AutoTokenizer.from_pretrained("togethercomputer/Pythia-Chat-Base-7B-v0.16")
model = AutoModelForCausalLM.from_pretrained("togethercomputer/Pythia-Chat-Base-7B-v0.16", device_map="auto", load_in_8bit=True)

# 推理
inputs = tokenizer("<human>: Hello!\n<bot>:", return_tensors='pt').to(model.device)
outputs = model.generate(**inputs, max_new_tokens=10, do_sample=True, temperature=0.8)
output_str = tokenizer.decode(outputs[0])
print(output_str)

CPU推理

from transformers import AutoTokenizer, AutoModelForCausalLM

# 初始化
tokenizer = AutoTokenizer.from_pretrained("togethercomputer/Pythia-Chat-Base-7B-v0.16")
model = AutoModelForCausalLM.from_pretrained("togethercomputer/Pythia-Chat-Base-7B-v0.16", torch_dtype=torch.bfloat16)

# 推理
inputs = tokenizer("<human>: Hello!\n<bot>:", return_tensors='pt').to(model.device)
outputs = model.generate(**inputs, max_new_tokens=10, do_sample=True, temperature=0.8)
output_str = tokenizer.decode(outputs[0])
print(output_str)

✨ 主要特性

基于Pythia-7B微调：Pythia-Chat-Base-7B-v0.16基于ElutherAI的Pythia-7B模型，使用专注于对话式交互的数据进行微调。微调聚焦于问答、分类、提取和总结等多个任务。
大量高质量指令微调：使用4300万条高质量指令对模型进行了微调。Together与LAION和Ontocord.ai合作，他们帮助整理了模型所基于的数据集。
进一步反馈数据微调：除了上述微调外，Pythia-Chat-Base-7B-v0.16还通过少量反馈数据进行了进一步微调，使模型能更好地适应人类在对话中的偏好。
低显存推理能力：得益于量化技术，该模型能够在12GB的GPU上进行推理，在保持对话能力的同时，使更多用户和硬件配置能够使用该模型。

📚 详细文档

模型详情

属性	详情
开发者	Together Computer
模型类型	语言模型
语言	英语
许可证	Apache 2.0
模型描述	一个70亿参数的开源聊天模型，基于EleutherAI的Pythia模型，在100%负碳排放的计算资源上使用超过4000万条指令进行微调
更多信息资源	GitHub仓库