Pythia-Chat-Base-7B開源對話模型 - 70億參數，超4000萬指令訓練

首頁

Pythia Chat Base 7B

由togethercomputer開發

基於EleutherAI Pythia-7B微調的70億參數開源對話模型，使用100%負碳計算資源訓練超過4000萬條指令

大型語言模型

Transformers

英語開源協議:Apache-2.0 #低顯存對話模型 #指令微調優化 #多任務對話

下載量 194

發布時間 : 3/22/2023

模型概述

專注於對話式交互的英語語言模型，優化了問答、分類、信息提取和摘要生成等任務

模型特點

低顯存需求

通過量化技術可在12GB顯存的GPU上運行推理

環保計算

使用100%負碳計算資源訓練

大規模指令微調

在4300萬條高質量指令數據集上進行微調

人類偏好優化

通過少量反饋數據進一步優化以適應人類對話偏好

模型能力

上下文問答

文本分類

信息提取

文本摘要

對話生成

小樣本學習

使用案例

研究領域

對話模型安全研究

研究潛在有害內容生成模型的安全部署

模型侷限性研究

探究對話模型/語言模型的侷限性與偏見

應用開發

教育工具開發

開發教育或創意工具應用

藝術創作輔助

作為藝術創作與設計輔助工具

🚀 Pythia-Chat-Base-7B-v0.16

Pythia-Chat-Base-7B-v0.16是一個基於70億參數的開源聊天模型。它基於EleutherAI的Pythia 7B模型微調而來，在100%負碳排放的計算資源上使用超過4000萬條指令進行訓練。該模型能夠在12GB的GPU上進行推理，具有廣泛的應用場景。

歡迎試用我們的 OpenChatKit反饋應用！

🚀 快速開始

GPU推理

此方法需要一個具有24GB內存的GPU。

from transformers import AutoTokenizer, AutoModelForCausalLM

# 初始化
tokenizer = AutoTokenizer.from_pretrained("togethercomputer/Pythia-Chat-Base-7B-v0.16")
model = AutoModelForCausalLM.from_pretrained("togethercomputer/Pythia-Chat-Base-7B-v0.16", torch_dtype=torch.float16)
model = model.to('cuda:0')

# 推理
inputs = tokenizer("<human>: Hello!\n<bot>:", return_tensors='pt').to(model.device)
outputs = model.generate(**inputs, max_new_tokens=10, do_sample=True, temperature=0.8)
output_str = tokenizer.decode(outputs[0])
print(output_str)

Int8格式的GPU推理

此方法需要一個具有12GB內存的GPU。

from transformers import AutoTokenizer, AutoModelForCausalLM

# 初始化
tokenizer = AutoTokenizer.from_pretrained("togethercomputer/Pythia-Chat-Base-7B-v0.16")
model = AutoModelForCausalLM.from_pretrained("togethercomputer/Pythia-Chat-Base-7B-v0.16", device_map="auto", load_in_8bit=True)

# 推理
inputs = tokenizer("<human>: Hello!\n<bot>:", return_tensors='pt').to(model.device)
outputs = model.generate(**inputs, max_new_tokens=10, do_sample=True, temperature=0.8)
output_str = tokenizer.decode(outputs[0])
print(output_str)

CPU推理

from transformers import AutoTokenizer, AutoModelForCausalLM

# 初始化
tokenizer = AutoTokenizer.from_pretrained("togethercomputer/Pythia-Chat-Base-7B-v0.16")
model = AutoModelForCausalLM.from_pretrained("togethercomputer/Pythia-Chat-Base-7B-v0.16", torch_dtype=torch.bfloat16)

# 推理
inputs = tokenizer("<human>: Hello!\n<bot>:", return_tensors='pt').to(model.device)
outputs = model.generate(**inputs, max_new_tokens=10, do_sample=True, temperature=0.8)
output_str = tokenizer.decode(outputs[0])
print(output_str)

✨ 主要特性

基於Pythia-7B微調：Pythia-Chat-Base-7B-v0.16基於ElutherAI的Pythia-7B模型，使用專注於對話式交互的數據進行微調。微調聚焦於問答、分類、提取和總結等多個任務。
大量高質量指令微調：使用4300萬條高質量指令對模型進行了微調。Together與LAION和Ontocord.ai合作，他們幫助整理了模型所基於的數據集。
進一步反饋數據微調：除了上述微調外，Pythia-Chat-Base-7B-v0.16還通過少量反饋數據進行了進一步微調，使模型能更好地適應人類在對話中的偏好。
低顯存推理能力：得益於量化技術，該模型能夠在12GB的GPU上進行推理，在保持對話能力的同時，使更多用戶和硬件配置能夠使用該模型。

📚 詳細文檔

模型詳情

屬性	詳情
開發者	Together Computer
模型類型	語言模型
語言	英語
許可證	Apache 2.0
模型描述	一個70億參數的開源聊天模型，基於EleutherAI的Pythia模型，在100%負碳排放的計算資源上使用超過4000萬條指令進行微調
更多信息資源	GitHub倉庫