CollectiveCognition-v1.1-Mistral-7Bオープンソース対話モデル - 無料でデプロイ可能、質問応答テストで良好な結果

ホーム

Collectivecognition V1.1 Mistral 7B

tekniumによって開発

Mistral-7Bを基に微調整した効率的な対話モデルで、TruthfulQAベンチマークで優れた性能を発揮

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #効率的な微調整 #TruthfulQAリーダー #少数サンプル最適化

ダウンロード数 63

リリース時間 : 10/4/2023

モデル概要

Mistral手法で微調整された先進的な対話モデルで、一般的な誤解の識別と修正に特に優れており、TruthfulQAベンチマークでは70B規模のモデルに匹敵

モデル特徴

効率的なトレーニング

単一の4090 GPUでqloraを使用してわずか3分でトレーニング可能

少数データで効率的

わずか100サンプルのデータでトレーニングしても優れた性能を達成

TruthfulQAで優れた性能

TruthfulQAベンチマークで複数の70B規模モデルを凌駕

低コストでの展開

7Bパラメータ規模でリソースが限られた環境での展開に適している

モデル能力

対話生成

質問応答システム

誤解識別

知識修正

使用事例

教育

知識質問応答システム

教育現場でのインテリジェントな質問応答に使用

一般的な知識の誤解を正確に識別し修正できる

カスタマーサポート

インテリジェントカスタマーサポート対話

効率的なカスタマーサービス対話サポートを提供

🚀 コレクティブコグニション v1.1 - ミストラル 7B

Collective Cognition v1.1は、Mistralアプローチを用いてファインチューニングされた最先端のモデルです。TruthfulQAベンチマークで多くの70Bモデルを上回る性能を発揮します。

📚 モデルの説明

Collective Cognition v1.1は、Mistralアプローチを用いてファインチューニングされた最先端のモデルです。このモデルは、TruthfulQAベンチマークで多くの70Bモデルを上回る性能を発揮しています。このベンチマークは、一般的な誤解に関するモデルの評価を行い、幻覚率を示す可能性があります。

✨ 主な機能

高速トレーニング：このモデルは、単一の4090でqloraを使用してわずか3分でトレーニングされ、TruthfulQAで70B規模のLlama - 2モデルと競争できます。
限定データ：例外的な性能にもかかわらず、ShareGPTに似たプラットフォームから収集されたわずか100のデータポイントでトレーニングされました。
極限のTruthfulQAベンチマーク：小さなデータセットとqloraトレーニングでありながら、このモデルはTruthfulQAベンチマークでトップの70Bモデルと強く競争しています！

image/png

🙏 謝辞

このモデルの開発を可能にした@a16zとCollective Cognitionデータセットのすべての貢献者に特別な感謝を申し上げます。

📦 データセット

このモデルは、Collective Cognitionのウェブサイトからのデータを使用してトレーニングされました。このデータセットの有効性は、モデルの卓越した性能によって実証されており、このデータセットをさらに拡張することで、さらに有望な結果が得られる可能性があります。データはShareGPTのようなプラットフォームから収集されたものに似ています。

あなたは、こちらで自分のChatGPTチャットを共有することで、データセットの拡充に貢献することができます。

Collective Cognitionによって作成されたデータセットはこちらからダウンロードできます: https://huggingface.co/CollectiveCognition

📈 性能

TruthfulQA：Collective Cognition v1.1は、TruthfulQAベンチマークで様々な70Bモデルを上回っており、一般的な誤解を理解して修正する能力を際立たせています。

💻 使用例

基本的な使用法

USER: <prompt>
ASSISTANT:

高度な使用法

<system message>
USER: <prompt>
ASSISTANT:

📊 ベンチマーク

Collective Cognition v1.0 TruthfulQA

|    Task     |Version|Metric|Value |   |Stderr|
|-------------|------:|------|-----:|---|-----:|
|truthfulqa_mc|      1|mc1   |0.4051|±  |0.0172|
|             |       |mc2   |0.5738|±  |0.0157|

Collective Cognition v1.1 GPT4All

|    Task     |Version| Metric |Value |   |Stderr|
|-------------|------:|--------|-----:|---|-----:|
|arc_challenge|      0|acc     |0.5085|±  |0.0146|
|             |       |acc_norm|0.5384|±  |0.0146|
|arc_easy     |      0|acc     |0.7963|±  |0.0083|
|             |       |acc_norm|0.7668|±  |0.0087|
|boolq        |      1|acc     |0.8495|±  |0.0063|
|hellaswag    |      0|acc     |0.6399|±  |0.0048|
|             |       |acc_norm|0.8247|±  |0.0038|
|openbookqa   |      0|acc     |0.3240|±  |0.0210|
|             |       |acc_norm|0.4540|±  |0.0223|
|piqa         |      0|acc     |0.7992|±  |0.0093|
|             |       |acc_norm|0.8107|±  |0.0091|
|winogrande   |      0|acc     |0.7348|±  |0.0124|
Average: 71.13

AGIEval

|             Task             |Version| Metric |Value |   |Stderr|
|------------------------------|------:|--------|-----:|---|-----:|
|agieval_aqua_rat              |      0|acc     |0.1929|±  |0.0248|
|                              |       |acc_norm|0.2008|±  |0.0252|
|agieval_logiqa_en             |      0|acc     |0.3134|±  |0.0182|
|                              |       |acc_norm|0.3333|±  |0.0185|
|agieval_lsat_ar               |      0|acc     |0.2217|±  |0.0275|
|                              |       |acc_norm|0.2043|±  |0.0266|
|agieval_lsat_lr               |      0|acc     |0.3412|±  |0.0210|
|                              |       |acc_norm|0.3216|±  |0.0207|
|agieval_lsat_rc               |      0|acc     |0.4721|±  |0.0305|
|                              |       |acc_norm|0.4201|±  |0.0301|
|agieval_sat_en                |      0|acc     |0.6068|±  |0.0341|
|                              |       |acc_norm|0.5777|±  |0.0345|
|agieval_sat_en_without_passage|      0|acc     |0.3932|±  |0.0341|
|                              |       |acc_norm|0.3641|±  |0.0336|
|agieval_sat_math              |      0|acc     |0.2864|±  |0.0305|
|                              |       |acc_norm|0.2636|±  |0.0298|
Average: 33.57

トレーニングの実行はこちらのwandbで確認できます: https://wandb.ai/teknium1/collectivecognition-mistral-7b/runs/collectivecognition-mistral-8/workspace