Mixtral-8x22B-Instruct-v0.1オープンソース大規模言語モデル - 多言語と関数呼び出し機能をサポート

ホーム

Mixtral 8x22B Instruct V0.1

mistralaiによって開発

Mixtral-8x22B-Instruct-v0.1はMixtral-8x22B-v0.1を基に命令ファインチューニングされた大規模言語モデルで、複数言語と関数呼び出し機能をサポートしています。

大規模言語モデル

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #マルチエキスパート混合モデル #多言語命令ファインチューニング #220Bパラメータ規模

ダウンロード数 12.80k

リリース時間 : 4/16/2024

モデル概要

これはMixtral-8x22Bアーキテクチャを基にした命令ファインチューニング大規模言語モデルで、対話と命令追従能力を最適化し、複数のプログラミング言語インターフェースとツール呼び出し機能をサポートしています。

モデル特徴

マルチエキスパートモデルアーキテクチャ

8つのエキスパートモデルの混合アーキテクチャを採用し、各入力トークンに対して動的に2つのエキスパートを選択して処理することで、モデルの効率を向上

多言語サポート

英語、スペイン語、イタリア語、ドイツ語、フランス語など複数言語をネイティブサポート

関数呼び出し機能

ツール呼び出しと関数実行をサポートし、外部APIやツールとの統合が可能

効率的な推論

モデル規模が大きいにも関わらず、エキスパート混合アーキテクチャにより比較的高効率な推論を実現

モデル能力

テキスト生成

対話システム

命令追従

多言語処理

関数呼び出し

ツール統合

使用事例

対話システム

インテリジェントアシスタント

多言語対応のインテリジェントアシスタントを構築し、ユーザーのクエリやタスクを処理

複雑な命令を理解し正確な応答を提供可能

開発者ツール

API統合

関数呼び出し機能を通じて外部APIやサービスを統合

動的なデータ取得と処理を実現

教育

多言語学習アシスタント

学生が複数言語の概念や表現を学ぶのを支援

🚀 Mixtral-8x22B-Instruct-v0.1のモデルカード

Mixtral-8x22B-Instruct-v0.1は、大規模言語モデル（LLM）であり、Mixtral-8x22B-v0.1 をインストラクションによってファインチューニングしたバージョンです。

🚀 クイックスタート

サポート言語

英語
スペイン語
イタリア語
ドイツ語
フランス語

ライセンス

このモデルはApache-2.0ライセンスの下で提供されています。

ベースモデル

mistralai/Mixtral-8x22B-v0.1

追加ゲート付き説明

個人情報の処理方法について詳しく知りたい場合は、プライバシーポリシーをご覧ください。

✨ 主な機能

このモデルは、多言語に対応した高性能な言語モデルであり、様々な自然言語処理タスクに利用できます。また、関数呼び出し機能をサポートしており、特定の関数を呼び出して情報を取得することができます。

💻 使用例

`mistral_common` を使用したエンコードとデコード

from mistral_common.tokens.tokenizers.mistral import MistralTokenizer
from mistral_common.protocol.instruct.messages import UserMessage
from mistral_common.protocol.instruct.request import ChatCompletionRequest
 
mistral_models_path = "MISTRAL_MODELS_PATH"
 
tokenizer = MistralTokenizer.v3()
 
completion_request = ChatCompletionRequest(messages=[UserMessage(content="Explain Machine Learning to me in a nutshell.")])
 
tokens = tokenizer.encode_chat_completion(completion_request).tokens

`mistral_inference` を使用した推論

from mistral_inference.transformer import Transformer
from mistral_inference.generate import generate
 
model = Transformer.from_folder(mistral_models_path)
out_tokens, _ = generate([tokens], model, max_tokens=64, temperature=0.0, eos_id=tokenizer.instruct_tokenizer.tokenizer.eos_id)

result = tokenizer.decode(out_tokens[0])

print(result)

Hugging Face `transformers` を使用した入力の準備

from transformers import AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("mistralai/Mixtral-8x22B-Instruct-v0.1")

chat = [{"role": "user", "content": "Explain Machine Learning to me in a nutshell."}]

tokens = tokenizer.apply_chat_template(chat, return_dict=True, return_tensors="pt", add_generation_prompt=True)

Hugging Face `transformers` を使用した推論

from transformers import AutoModelForCausalLM
import torch

# You can also use 8-bit or 4-bit quantization here
model = AutoModelForCausalLM.from_pretrained("mistralai/Mixtral-8x22B-Instruct-v0.1", torch_dtype=torch.bfloat16, device_map="auto")
model.to("cuda")
 
generated_ids = model.generate(**tokens, max_new_tokens=1000, do_sample=True)

# decode with HF tokenizer
result = tokenizer.decode(generated_ids[0])
print(result)

関数呼び出しの例

from transformers import AutoModelForCausalLM
from mistral_common.protocol.instruct.messages import (
    AssistantMessage,
    UserMessage,
)
from mistral_common.protocol.instruct.tool_calls import (
    Tool,
    Function,
)
from mistral_common.tokens.tokenizers.mistral import MistralTokenizer
from mistral_common.tokens.instruct.normalize import ChatCompletionRequest

device = "cuda" # the device to load the model onto

tokenizer_v3 = MistralTokenizer.v3()

mistral_query = ChatCompletionRequest(
    tools=[
        Tool(
            function=Function(
                name="get_current_weather",
                description="Get the current weather",
                parameters={
                    "type": "object",
                    "properties": {
                        "location": {
                            "type": "string",
                            "description": "The city and state, e.g. San Francisco, CA",
                        },
                        "format": {
                            "type": "string",
                            "enum": ["celsius", "fahrenheit"],
                            "description": "The temperature unit to use. Infer this from the users location.",
                        },
                    },
                    "required": ["location", "format"],
                },
            )
        )
    ],
    messages=[
        UserMessage(content="What's the weather like today in Paris"),
    ],
    model="test",
)

encodeds = tokenizer_v3.encode_chat_completion(mistral_query).tokens
model = AutoModelForCausalLM.from_pretrained("mistralai/Mixtral-8x22B-Instruct-v0.1")
model_inputs = encodeds.to(device)
model.to(device)

generated_ids = model.generate(model_inputs, max_new_tokens=1000, do_sample=True)
sp_tokenizer = tokenizer_v3.instruct_tokenizer.tokenizer
decoded = sp_tokenizer.decode(generated_ids[0])
print(decoded)

`transformers` を使用した関数呼び出し

この例を使用するには、transformers バージョン4.42.0以上が必要です。詳細については、関数呼び出しガイドを参照してください。

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

model_id = "mistralai/Mixtral-8x22B-Instruct-v0.1"
tokenizer = AutoTokenizer.from_pretrained(model_id)

def get_current_weather(location: str, format: str):
    """
    Get the current weather

    Args:
        location: The city and state, e.g. San Francisco, CA
        format: The temperature unit to use. Infer this from the users location. (choices: ["celsius", "fahrenheit"])
    """
    pass

conversation = [{"role": "user", "content": "What's the weather like in Paris?"}]
tools = [get_current_weather]

# format and tokenize the tool use prompt 
inputs = tokenizer.apply_chat_template(
            conversation,
            tools=tools,
            add_generation_prompt=True,
            return_dict=True,
            return_tensors="pt",
)

model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.bfloat16, device_map="auto")

inputs.to(model.device)
outputs = model.generate(**inputs, max_new_tokens=1000)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

インストラクショントークナイザ

このリリースに含まれるHuggingFaceトークナイザは、独自のトークナイザと一致するはずです。比較するには、pip install mistral-common を実行してください。

from mistral_common.protocol.instruct.messages import (
    AssistantMessage,
    UserMessage,
)
from mistral_common.tokens.tokenizers.mistral import MistralTokenizer
from mistral_common.tokens.instruct.normalize import ChatCompletionRequest

from transformers import AutoTokenizer

tokenizer_v3 = MistralTokenizer.v3()

mistral_query = ChatCompletionRequest(
    messages=[
        UserMessage(content="How many experts ?"),
        AssistantMessage(content="8"),
        UserMessage(content="How big ?"),
        AssistantMessage(content="22B"),
        UserMessage(content="Noice 🎉 !"),
    ],
    model="test",
)
hf_messages = mistral_query.model_dump()['messages']

tokenized_mistral = tokenizer_v3.encode_chat_completion(mistral_query).tokens

tokenizer_hf = AutoTokenizer.from_pretrained('mistralai/Mixtral-8x22B-Instruct-v0.1')
tokenized_hf = tokenizer_hf.apply_chat_template(hf_messages, tokenize=True)

assert tokenized_hf == tokenized_mistral

関数呼び出しと特殊トークン

このトークナイザには、関数呼び出しに関連する追加の特殊トークンが含まれています。

[TOOL_CALLS]
[AVAILABLE_TOOLS]
[/AVAILABLE_TOOLS]
[TOOL_RESULTS]
[/TOOL_RESULTS]

このモデルを関数呼び出しで使用する場合は、SentencePieceTokenizerV3 で行われているように適用することを確認してください。

📄 ライセンス

このモデルはApache-2.0ライセンスの下で提供されています。

👥 Mistral AIチーム

Albert Jiang, Alexandre Sablayrolles, Alexis Tacnet, Antoine Roux, Arthur Mensch, Audrey Herblin-Stoop, Baptiste Bout, Baudouin de Monicault, Blanche Savary, Bam4d, Caroline Feldman, Devendra Singh Chaplot, Diego de las Casas, Eleonore Arcelin, Emma Bou Hanna, Etienne Metzger, Gianna Lengyel, Guillaume Bour, Guillaume Lample, Harizo Rajaona, Jean-Malo Delignon, Jia Li, Justus Murke, Louis Martin, Louis Ternon, Lucile Saulnier, Lélio Renard Lavaud, Margaret Jennings, Marie Pellat, Marie Torelli, Marie-Anne Lachaux, Nicolas Schuhl, Patrick von Platen, Pierre Stock, Sandeep Subramanian, Sophia Yang, Szymon Antoniak, Teven Le Scao, Thibaut Lavril, Timothée Lacroix, Théophile Gervet, Thomas Wang, Valera Nemychnikova, William El Sayed, William Marshall