OpenChat v2オープンソース言語モデル - ChatGPTを超え、無料でスマートチャットアプリをサポート

ホーム

Openchat V2

openchatによって開発

OpenChat v2シリーズはLLaMA-13Bフレームワークを基にした言語モデルで、条件付き加重損失トレーニングを採用し、複数のベンチマークテストでChatGPTの性能を上回っています。

大規模言語モデル

Transformers

英語オープンソースライセンス:その他 #マルチターン対話最適化 #強化学習トレーニング #ChatGPT類似性能

ダウンロード数 1,090

リリース時間 : 7/7/2023

モデル概要

OpenChat v2シリーズはオフライン強化学習に着想を得ており、条件付き行動クローンと加重行動クローンの2つのバージョンを含み、オープンソース言語モデルの対話能力向上に焦点を当てています。

モデル特徴

高性能対話能力

MT-bench、Vicuna-bench、AlpacaEvalなどの複数のベンチマークテストでChatGPTの性能を上回っています

条件付き加重トレーニング

条件付き加重損失トレーニング手法を採用してモデル性能を最適化

長文脈サポート

2048トークンの文脈長をサポート

モデル能力

テキスト生成

マルチターン対話

指示追従

使用事例

対話システム

インテリジェントカスタマーサポート

高性能なカスタマーサポート対話システムの構築に使用

ベンチマークテストで79.4%の勝率を達成しChatGPTを上回りました

パーソナルアシスタント

自然言語インタラクションを提供する個人デジタルアシスタントとして

AlpacaEvalベンチマークテストで87.1%の勝率を達成しtext-davinci-003を上回りました

🚀 OpenChat: 不完全なデータでオープンソース言語モデルを進化させる

OpenChat v2ファミリーは、オフライン強化学習に触発されて開発されており、条件付き行動クローニング（OpenChat-v2）と重み付き行動クローニング（OpenChat-v2-w）が含まれています。

OpenChat-v2-w: 約80kのクリーニングされたShareGPTデータを条件付きと重み付き損失で使用し、コンテキスト長2048のLLaMA-13Bをベースにしています。
- MT-benchでChatGPTに対して**50.9%**の勝率を達成しました。
- Vicuna-benchでChatGPTに対して**79.4%**の勝率を達成しました。
- AlpacaEvalでtext-davinci-003に対して**87.1%**の勝率を達成しました。
OpenChat-v2: 約80kのクリーニングされたShareGPTデータを条件付きのみで使用し、コンテキスト長2048のLLaMA-13Bをベースにしています。
- MT-benchでChatGPTに対して**48.1%**の勝率を達成しました。
- Vicuna-benchでChatGPTに対して**80.6%**の勝率を達成しました。
- AlpacaEvalでtext-davinci-003に対して**85.0%**の勝率を達成しました。

✨ 主要特性

コードと推論サーバー

OpenChatのGitHubリポジトリには、「ChatCompletions」APIと互換性のある推論サーバーを含む完全なソースコードが提供されています。

Web UI

OpenChatには、ユーザー体験を向上させるためのWeb UIも含まれています。詳細な手順はGitHubリポジトリを参照してください。

会話テンプレート

会話テンプレートはトークンを連結する必要があり、平文で表現することはできません。

ベースモデルの語彙に加えて、ターン終了トークン <|end_of_turn|> が追加されています。

以下は、単一ラウンドの会話テンプレートの例です。

def tokenize_single_input(tokenizer, prompt):
    # OpenChat V2
    human_prefix = "User:"
    prefix    = "Assistant GPT4:"
    eot_token = "<|end_of_turn|>"
    bos_token = "<s>"

    def _tokenize(text):
        return tokenizer.convert_tokens_to_ids(tokenizer._tokenize(text))

    def _tokenize_special(special_name):
        return tokenizer.convert_tokens_to_ids(special_name)
    
    return [_tokenize_special(bos_token)] + _tokenize(human_prefix) + _tokenize(prompt) + [_tokenize_special(eot_token)] + \
           _tokenize(prefix)