Mistral-7B-OpenOrca開源大語言模型 - 免費部署，性能超越同類7B和13B模型

首頁

Mistral 7B OpenOrca

由Open-Orca開發

基於Mistral-7B微調的開源大語言模型，使用OpenOrca數據集訓練，性能超越同類7B和13B模型

大型語言模型

Transformers

英語開源協議:Apache-2.0 #指令微調 #GPT-4級性能 #消費級GPU優化

下載量 28.01k

發布時間 : 9/29/2023

模型概述

這是一個在Mistral-7B基礎上使用OpenOrca數據集微調的大型語言模型，採用OpenChat打包技術和Axolotl訓練器訓練，在多項基準測試中表現優異

模型特點

高性能

在HuggingFace排行榜上超越所有7B和13B模型，達到Llama2-70b-chat性能的98.6%

開源可用

完全開源模型，可在中等消費級GPU上完全加速運行

精細微調

使用精選的GPT-4增強數據子集進行訓練，採用OpenChat打包技術

模型能力

文本生成

對話系統

知識問答

推理任務

使用案例

對話系統

智能助手

可用於構建高性能的對話式AI助手

在MT-Bench測試中表現與Llama2-70b-chat相當

教育研究

學術問答

可用於回答學術問題和提供解釋

在AGIEval上達到基礎模型性能的129%

🚀 🐋 Mistral-7B-OpenOrca 🐋

Mistral-7B-OpenOrca 是基於 Mistral 7B 模型，使用 OpenOrca 數據集進行微調得到的大語言模型。它在多個評測基準中表現出色，在小於 30B 的模型中排名第一，甚至能在性能上媲美 Llama2-70b-chat，且能在普通消費級 GPU 上全加速運行。

OpenOrca Logo

🚀 快速開始

如果你想立即體驗該模型，可訪問：https://huggingface.co/spaces/Open-Orca/Mistral-7B-OpenOrca ，這裡使用了快速 GPU 且模型未進行量化。

若想可視化完整（預過濾）數據集，可查看 Nomic Atlas Map。

Nomic Atlas Map

✨ 主要特性

高性能：在發佈時，在小於 30B 的所有模型中，該模型在 HuggingFace 排行榜評估中排名第一，超越了所有其他 7B 和 13B 模型。
全開源：這是一個完全開源的模型，具有突破性的性能，甚至能在普通消費級 GPU 上全加速運行。
多基準領先：在 AGIEval、BigBench-Hard、GPT4ALL 排行榜、MT-Bench 等多個評測基準中均有出色表現。

📦 安裝指南

由於 Mistral 的支持尚未發佈到 PyPI，你需要安裝 Transformers 的開發快照：

pip install git+https://github.com/huggingface/transformers

💻 使用示例

基礎用法

chat = [
  {"role": "system", "content": "You are MistralOrca, a large language model trained by Alignment Lab AI. Write out your reasoning step-by-step to be sure you get the right answers!"},
  {"role": "user", "content": "How are you?"},
  {"role": "assistant", "content": "I am doing well!"},
  {"role": "user", "content": "Please tell me about how mistral winds have attracted super-orcas."},
]
tokenizer.apply_chat_template(chat, tokenize=False, add_generation_prompt=True)

上述代碼將輸出：

<|im_start|>system
You are MistralOrca, a large language model trained by Alignment Lab AI. Write out your reasoning step-by-step to be sure you get the right answers!
<|im_end|>
<|im_start|>user
How are you?<|im_end|>
<|im_start|>assistant
I am doing well!<|im_end|>
<|im_start|>user
Please tell me about how mistral winds have attracted super-orcas.<|im_end|>
<|im_start|>assistant

如果你使用 tokenize=True 和 return_tensors="pt"，則會得到一個經過分詞和格式化的對話，可直接傳遞給 model.generate()。

高級用法

推理詳情可查看此筆記本。

📚 詳細文檔

量化模型

該模型的量化版本由 TheBloke 慷慨提供：

AWQ: https://huggingface.co/TheBloke/Mistral-7B-OpenOrca-AWQ
GPTQ: https://huggingface.co/TheBloke/Mistral-7B-OpenOrca-GPTQ
GGUF: https://huggingface.co/TheBloke/Mistral-7B-OpenOrca-GGUF

提示模板

模型使用 OpenAI 的聊天標記語言 (ChatML) 格式，並添加了 <|im_start|> 和 <|im_end|> 標記以支持該格式。

這意味著，例如在 oobabooga 中，“MPT-Chat” 指令模板應該可以使用，因為它也使用了 ChatML。

這種格式化也可以通過預定義的 Transformers 聊天模板獲得，這意味著可以使用 apply_chat_template() 方法為你格式化消息列表。

評估

HuggingFace 排行榜性能

使用 HuggingFace 排行榜的方法和工具進行評估，發現該模型在基礎模型上有顯著改進。在 HuggingFace 排行榜評估中達到了基礎模型性能的 106%，平均分為 65.84。

發佈時，該模型擊敗了所有 7B 和 13B 模型，其性能也是 Llama2-70b-chat 的 98.6%。

HF 排行榜

指標	值
MMLU (5-shot)	62.24
ARC (25-shot)	64.08
HellaSwag (10-shot)	83.99
TruthfulQA (0-shot)	53.05
平均分	65.84

使用語言模型評估工具包運行上述基準測試，使用的版本與 HuggingFace LLM 排行榜相同。

AGIEval 性能

與基礎 Mistral-7B 模型（使用 LM 評估工具包）相比，在 AGI 評估中達到了基礎模型性能的 129%，平均分為 0.397。同時，也顯著優於官方 mistralai/Mistral-7B-Instruct-v0.1 微調版本，達到了其性能的 119%。

AGIEval 性能

BigBench-Hard 性能

在 BigBench-Hard 評估中達到了基礎模型性能的 119%，平均分為 0.416。

BigBench-Hard 性能

GPT4ALL 排行榜性能

與之前的版本相比略有優勢，再次位居排行榜榜首，平均分為 72.38。

GPT4ALL 性能

MT-Bench 性能

MT-Bench 使用 GPT-4 作為模型響應質量的評判標準，涵蓋了廣泛的挑戰。該模型的性能與 Llama2-70b-chat 相當，平均分為 6.86。

MT-Bench 性能

數據集

使用了 OpenOrca 數據集中經過精心挑選和過濾的大部分 GPT-4 增強數據，該數據集旨在重現 Orca 研究論文數據集。

訓練

使用 8 個 A6000 GPU 進行了 62 小時的訓練，在一次訓練運行中對數據集完成了 4 個週期的全微調。成本約為 400 美元。

🔧 技術細節

模型類型：基於 Mistral 7B 微調的大語言模型
訓練數據：OpenOrca 數據集中經過篩選的 GPT-4 增強數據
訓練環境：8x A6000 GPUs，訓練時長 62 小時，完成 4 個週期的全微調

📄 許可證

本項目採用 apache-2.0 許可證。

📖 引用

@software{lian2023mistralorca1
  title = {MistralOrca: Mistral-7B Model Instruct-tuned on Filtered OpenOrcaV1 GPT-4 Dataset},
  author = {Wing Lian and Bleys Goodson and Guan Wang and Eugene Pentland and Austin Cook and Chanvichet Vong and "Teknium"},
  year = {2023},
  publisher = {HuggingFace},
  journal = {HuggingFace repository},
  howpublished = {\url{https://huggingface.co/Open-Orca/Mistral-7B-OpenOrca},
}
@misc{mukherjee2023orca,
      title={Orca: Progressive Learning from Complex Explanation Traces of GPT-4}, 
      author={Subhabrata Mukherjee and Arindam Mitra and Ganesh Jawahar and Sahaj Agarwal and Hamid Palangi and Ahmed Awadallah},
      year={2023},
      eprint={2306.02707},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}
@misc{longpre2023flan,
      title={The Flan Collection: Designing Data and Methods for Effective Instruction Tuning}, 
      author={Shayne Longpre and Le Hou and Tu Vu and Albert Webson and Hyung Won Chung and Yi Tay and Denny Zhou and Quoc V. Le and Barret Zoph and Jason Wei and Adam Roberts},
      year={2023},
      eprint={2301.13688},
      archivePrefix={arXiv},
      primaryClass={cs.AI}
}