OpenChat開源語言模型 - 免費部署，有限數據實現高性能多輪對話

首頁

Openchat

由openchat開發

OpenChat是一系列開源語言模型，在多樣化且高質量的多輪對話數據集上進行了微調，旨在用有限的數據實現高性能。

大型語言模型

Transformers

英語開源協議:其他 #高效微調 #多輪對話 #開源LLM

下載量 1,786

發布時間 : 6/22/2023

模型概述

OpenChat是基於LLaMA和StarCoderPlus的開源語言模型，專注於多輪對話任務，通過精選的小規模高質量數據實現優異性能。

模型特點

高效數據利用

僅使用約6000條精選GPT-4對話數據進行微調即達到優異性能

多版本支持

提供標準版(2048上下文)和擴展版(8192上下文)滿足不同需求

代碼專用模型

OpenCoderPlus針對代碼生成任務優化，基於StarCoderPlus架構

高性能表現

在Vicuna GPT-4評估中得分超過ChatGPT，AlpacaEval勝率近80%

模型能力

多輪對話生成

代碼生成

自然語言理解

上下文感知響應

使用案例

對話系統

智能客服

構建高性能客服對話系統

在Vicuna評估中達到ChatGPT 105.7%性能

個人助手

開發個性化數字助手

支持長達8192token的上下文記憶

編程輔助

代碼生成

基於自然語言描述生成代碼

在代碼任務上達到ChatGPT 102.5%性能

🚀 OpenChat：開源模型，少即是多

OpenChat 是一系列開源語言模型，在多樣化且高質量的多輪對話數據集上進行了微調。僅使用從約 9 萬條 ShareGPT 對話中篩選出的約 6000 條 GPT - 4 對話，OpenChat 旨在用有限的數據實現高性能。

✨ 主要特性

通用模型

OpenChat：基於 LLaMA - 13B（上下文長度 2048）
- 在 Vicuna GPT - 4 評估中，得分達到 ChatGPT 的 105.7%
- 在 AlpacaEval 中的勝率為 80.9%
- 僅使用 6000 條數據進行微調！！！
OpenChat - 8192：基於 LLaMA - 13B（上下文長度擴展至 8192）
- 在 Vicuna GPT - 4 評估中，得分達到 ChatGPT 的 106.6%
- 在 AlpacaEval 中的勝率為 79.5%

代碼模型

OpenCoderPlus：基於 StarCoderPlus（原生上下文長度 8192）
- 在 Vicuna GPT - 4 評估中，得分達到 ChatGPT 的 102.5%
- 在 AlpacaEval 中的勝率為 78.7%

⚠️ 重要提示

請使用 bfloat16 加載預訓練模型。

🚀 快速開始

代碼與推理服務器

我們在 OpenChat GitHub 倉庫中提供了完整的源代碼，包括一個與“ChatCompletions”API 兼容的推理服務器。

Web 界面

OpenChat 還包含一個 Web 界面，以提供更好的用戶體驗。具體說明請參考 GitHub 倉庫。

💻 使用示例

對話模板

對話模板 涉及拼接令牌。

除了基礎模型詞彙表外，還添加了一個回合結束令牌 <|end_of_turn|>，其 ID 為 eot_token_id。

# OpenChat
[bos_token_id] + tokenize("Human: ") + tokenize(user_question) + [eot_token_id] + tokenize("Assistant: ")
# OpenCoder
tokenize("User:") + tokenize(user_question) + [eot_token_id] + tokenize("Assistant:")

💡 使用建議

在字節對編碼（BPE）中，tokenize(A) + tokenize(B) 並不總是等於 tokenize(A + B)。

以下是生成對話模板的代碼：

@dataclass
class ModelConfig:
    # Prompt
    system: Optional[str]

    role_prefix: dict
    ai_role: str
    eot_token: str
    bos_token: Optional[str] = None

    # Get template
    def generate_conversation_template(self, tokenize_fn, tokenize_special_fn, message_list):
        tokens = []
        masks = []

        # begin of sentence (bos)
        if self.bos_token:
            t = tokenize_special_fn(self.bos_token)
            tokens.append(t)
            masks.append(False)

        # System
        if self.system:
            t = tokenize_fn(self.system) + [tokenize_special_fn(self.eot_token)]
            tokens.extend(t)
            masks.extend([False] * len(t))

        # Messages
        for idx, message in enumerate(message_list):
            # Prefix
            t = tokenize_fn(self.role_prefix[message["from"]])
            tokens.extend(t)
            masks.extend([False] * len(t))

            # Message
            if "value" in message:
                t = tokenize_fn(message["value"]) + [tokenize_special_fn(self.eot_token)]
                tokens.extend(t)
                masks.extend([message["from"] == self.ai_role] * len(t))
            else:
                assert idx == len(message_list) - 1, "Empty message for completion must be on the last."

        return tokens, masks


MODEL_CONFIG_MAP = {
    # OpenChat / OpenChat-8192
    "openchat": ModelConfig(
        # Prompt
        system=None,

        role_prefix={
            "human": "Human: ",
            "gpt": "Assistant: "
        },
        ai_role="gpt",
        eot_token="<|end_of_turn|>",
        bos_token="<s>",
    ),

    # OpenCoder / OpenCoderPlus
    "opencoder": ModelConfig(
        # Prompt
        system=None,

        role_prefix={
            "human": "User:",
            "gpt": "Assistant:"
        },
        ai_role="gpt",
        eot_token="<|end_of_turn|>",
        bos_token=None,
    )
}

📄 許可證

我們的模型權重許可證遵循其相應基礎模型的規定。例如，OpenChat 和 OpenChat - 8192 與 LLaMA 的模型許可證相同，僅用於非商業用途；而 OpenCoderPlus 遵循 StarCoder 的許可證。此外，我們還需遵守 ShareGPT 的隱私政策。在 GitHub 上發佈的代碼遵循 Apache License 2.0。

📚 詳細文檔

引用信息

@software{openllms23,
  title = {{OpenLLMs: Less is More for Open-source Models}},
  author = {Wang, Guan and Cheng, Sijie and Yu, Qiying and Liu, Changling},
  doi = {10.5281/zenodo.8105775},
  url = {https://github.com/imoneoi/openchat},
  version = {pre-release},
  year = {2023},
  month = {7},
}