Mixtral-8x7B-Instruct-v0.1-HFオープンソース大規模言語モデル - 性能はLlama 2 70Bを上回り、生成内容も非常に優れています

ホーム

Mixtral 8x7B Instruct V0.1 HF

LoneStrikerによって開発

Mixtral-8x7Bは事前学習済みの生成型スパース混合エキスパート大規模言語モデルで、ほとんどのベンチマークテストでLlama 2 70Bを上回る性能を示しています。

大規模言語モデル

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #スパース混合エキスパート #多言語インストラクション追従 #高精度生成

ダウンロード数 45

リリース時間 : 12/11/2023

モデル概要

Mixtral-8x7Bは高性能な大規模言語モデルで、多言語インストラクション追従とテキスト生成タスクをサポートします。

モデル特徴

スパース混合エキスパートアーキテクチャ

8つのエキスパートモデルからなるスパース混合アーキテクチャを採用し、高効率を維持しながら高品質な出力を提供

多言語サポート

フランス語、イタリア語、ドイツ語、スペイン語、英語など複数言語をネイティブサポート

高性能

ほとんどのベンチマークテストでLlama 2 70Bモデルを上回る性能

インストラクション最適化

特に最適化されたインストラクション追従能力で、対話やタスク完了シナリオに適している

モデル能力

多言語テキスト生成

インストラクション理解と実行

対話システム

コンテンツ作成

使用事例

対話システム

インテリジェントアシスタント

多言語インテリジェントアシスタントを構築し、ユーザーの指示を理解して実行

指示に沿った一貫性のある応答を生成可能

コンテンツ作成

多言語コンテンツ生成

様々な言語でマーケティングコピーや記事などを生成

流暢で文脈に合ったテキストを生成

🚀 Hugging Face TransformersによるMixtral-8x7B-Instructの変換

Mixtral-8x7Bは事前学習された生成型の疎なエキスパート混合モデルで、多くのベンチマークでLlama 2 70Bを上回る性能を発揮します。

🚀 クイックスタート

Mixtral-8x7Bモデルの詳細については、リリースブログ記事をご覧ください。

✨ 主な機能

このモデルは、事前学習された生成型の疎なエキスパート混合モデルで、多くのベンチマークでLlama 2 70Bを上回る性能を発揮します。

📦 インストール

このリポジトリには、vLLMによるモデルのサービングや、Hugging Faceのtransformersライブラリと互換性のある重みが含まれています。元のMixtral torrentリリースに基づいていますが、ファイル形式とパラメータ名は異なります。なお、現時点ではモデルをHFでインスタンス化することはできません。

💻 使用例

基本的な使用法

from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "mistralai/Mixtral-8x7B-Instruct-v0.1"
tokenizer = AutoTokenizer.from_pretrained(model_id)

model = AutoModelForCausalLM.from_pretrained(model_id)

text = "Hello my name is"
inputs = tokenizer(text, return_tensors="pt")

outputs = model.generate(**inputs, max_new_tokens=20)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

高度な使用法

半精度での実行

float16精度はGPUデバイスでのみ動作します。

+ import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "mistralai/Mixtral-8x7B-Instruct-v0.1"
tokenizer = AutoTokenizer.from_pretrained(model_id)

+ model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.float16).to(0)

text = "Hello my name is"
+ inputs = tokenizer(text, return_tensors="pt").to(0)

outputs = model.generate(**inputs, max_new_tokens=20)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

`bitsandbytes`を使用した低精度化（8ビットと4ビット）

+ import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "mistralai/Mixtral-8x7B-Instruct-v0.1"
tokenizer = AutoTokenizer.from_pretrained(model_id)

+ model = AutoModelForCausalLM.from_pretrained(model_id, load_in_4bit=True)

text = "Hello my name is"
+ inputs = tokenizer(text, return_tensors="pt").to(0)

outputs = model.generate(**inputs, max_new_tokens=20)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

Flash Attention 2を使用したモデルの読み込み

+ import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "mistralai/Mixtral-8x7B-Instruct-v0.1"
tokenizer = AutoTokenizer.from_pretrained(model_id)

+ model = AutoModelForCausalLM.from_pretrained(model_id, use_flash_attention_2=True)

text = "Hello my name is"
+ inputs = tokenizer(text, return_tensors="pt").to(0)

outputs = model.generate(**inputs, max_new_tokens=20)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

📚 ドキュメント

命令フォーマット

このフォーマットは厳密に守る必要があります。そうしないと、モデルは最適でない出力を生成します。

Instructモデルのプロンプトを構築するために使用されるテンプレートは、以下のように定義されています。

<s> [INST] 命令 [/INST] モデルの回答</s> [INST] 続きの命令 [/INST]

<s> と </s> は文字列の開始（BOS）と終了（EOS）の特殊トークンで、[INST] と [/INST] は通常の文字列です。

参考までに、微調整中に命令をトークン化するために使用される疑似コードを以下に示します。

def tokenize(text):
    return tok.encode(text, add_special_tokens=False)

[BOS_ID] + 
tokenize("[INST]") + tokenize(USER_MESSAGE_1) + tokenize("[/INST]") +
tokenize(BOT_MESSAGE_1) + [EOS_ID] +
…
tokenize("[INST]") + tokenize(USER_MESSAGE_N) + tokenize("[/INST]") +
tokenize(BOT_MESSAGE_N) + [EOS_ID]

上記の疑似コードでは、tokenize メソッドは自動的にBOSまたはEOSトークンを追加しないで、接頭辞の空白を追加する必要があります。

制限事項

Mixtral-8x7B Instructモデルは、ベースモデルを簡単に微調整して魅力的な性能を達成できることをすばやく実証するものです。このモデルにはモデレーションメカニズムがありません。モデルがガードレールをきめ細かく尊重し、モデレートされた出力が必要な環境でのデプロイを可能にする方法について、コミュニティと協力したいと考えています。

📄 ライセンス

このモデルはApache-2.0ライセンスの下で提供されています。

ミストラルAIチーム

Albert Jiang、Alexandre Sablayrolles、Arthur Mensch、Blanche Savary、Chris Bamford、Devendra Singh Chaplot、Diego de las Casas、Emma Bou Hanna、Florian Bressand、Gianna Lengyel、Guillaume Bour、Guillaume Lample、Lélio Renard Lavaud、Louis Ternon、Lucile Saulnier、Marie - Anne Lachaux、Pierre Stock、Teven Le Scao、Théophile Gervet、Thibaut Lavril、Thomas Wang、Timothée Lacroix、William El Sayed。