Mistral-7B-Instruct-v0.3オープンソース大規模言語モデル - 関数呼び出しと拡張語彙表をサポート

ホーム

Mistral 7B Instruct V0.3

mistralaiによって開発

Mistral-7B-Instruct-v0.3 は Mistral-7B-v0.3 を基に命令ファインチューニングされた大規模言語モデルで、関数呼び出しと拡張語彙表をサポートしています。

大規模言語モデル

Transformers

オープンソースライセンス:Apache-2.0 #命令ファインチューニング #関数呼び出しサポート #マルチターン対話最適化

ダウンロード数 709.57k

リリース時間 : 5/22/2024

モデル概要

これは命令ファインチューニングされた大規模言語モデルで、ユーザーの指示に従うことや関数呼び出しのために設計されており、様々な自然言語処理タスクに適しています。

モデル特徴

拡張語彙表

語彙表を32768まで拡張し、複雑なテキスト処理能力を向上させました。

関数呼び出しサポート

ツール呼び出しや関数実行をサポートし、モデルの実用性を強化しました。

改良されたトークナイザー

v3トークナイザーを使用し、テキスト処理の効率と精度を向上させました。

モデル能力

テキスト生成

命令追従

関数呼び出し

マルチターン対話

使用事例

対話システム

チャットボット

インテリジェントなチャットボットとして、ユーザーの質問に答えたり支援を提供したりできます。

自然で流暢な対話応答を生成できます。

ツール統合

天気予報

関数呼び出しを通じてリアルタイムの天気情報を取得します。

ユーザーのリクエストを正しく解析し、天気APIを呼び出せます。

🚀 Mistral-7B-Instruct-v0.3 モデルカード

Mistral-7B-Instruct-v0.3 大規模言語モデル (LLM) は、Mistral-7B-v0.3 を命令に関してファインチューニングしたバージョンです。

Mistral-7B-v0.3 は、Mistral-7B-v0.2 と比較して以下の変更があります。

語彙数を 32768 に拡張
v3 トークナイザーをサポート
関数呼び出しをサポート

📦 インストール

mistralai/Mistral-7B-Instruct-v0.3 を使用する場合は、mistral-inference を推奨します。HF transformers のコードスニペットについては、下にスクロールしてください。

pip install mistral_inference

📥 ダウンロード

from huggingface_hub import snapshot_download
from pathlib import Path

mistral_models_path = Path.home().joinpath('mistral_models', '7B-Instruct-v0.3')
mistral_models_path.mkdir(parents=True, exist_ok=True)

snapshot_download(repo_id="mistralai/Mistral-7B-Instruct-v0.3", allow_patterns=["params.json", "consolidated.safetensors", "tokenizer.model.v3"], local_dir=mistral_models_path)

💬 チャット

mistral_inference をインストールした後、環境に mistral-chat CLI コマンドが利用可能になります。以下のコマンドでモデルとチャットできます。

mistral-chat $HOME/mistral_models/7B-Instruct-v0.3 --instruct --max_tokens 256

📝 命令に従う

from mistral_inference.transformer import Transformer
from mistral_inference.generate import generate

from mistral_common.tokens.tokenizers.mistral import MistralTokenizer
from mistral_common.protocol.instruct.messages import UserMessage
from mistral_common.protocol.instruct.request import ChatCompletionRequest


tokenizer = MistralTokenizer.from_file(f"{mistral_models_path}/tokenizer.model.v3")
model = Transformer.from_folder(mistral_models_path)

completion_request = ChatCompletionRequest(messages=[UserMessage(content="Explain Machine Learning to me in a nutshell.")])

tokens = tokenizer.encode_chat_completion(completion_request).tokens

out_tokens, _ = generate([tokens], model, max_tokens=64, temperature=0.0, eos_id=tokenizer.instruct_tokenizer.tokenizer.eos_id)
result = tokenizer.instruct_tokenizer.tokenizer.decode(out_tokens[0])

print(result)

🛠️ 関数呼び出し

from mistral_common.protocol.instruct.tool_calls import Function, Tool
from mistral_inference.transformer import Transformer
from mistral_inference.generate import generate

from mistral_common.tokens.tokenizers.mistral import MistralTokenizer
from mistral_common.protocol.instruct.messages import UserMessage
from mistral_common.protocol.instruct.request import ChatCompletionRequest


tokenizer = MistralTokenizer.from_file(f"{mistral_models_path}/tokenizer.model.v3")
model = Transformer.from_folder(mistral_models_path)

completion_request = ChatCompletionRequest(
    tools=[
        Tool(
            function=Function(
                name="get_current_weather",
                description="Get the current weather",
                parameters={
                    "type": "object",
                    "properties": {
                        "location": {
                            "type": "string",
                            "description": "The city and state, e.g. San Francisco, CA",
                        },
                        "format": {
                            "type": "string",
                            "enum": ["celsius", "fahrenheit"],
                            "description": "The temperature unit to use. Infer this from the users location.",
                        },
                    },
                    "required": ["location", "format"],
                },
            )
        )
    ],
    messages=[
        UserMessage(content="What's the weather like today in Paris?"),
        ],
)

tokens = tokenizer.encode_chat_completion(completion_request).tokens

out_tokens, _ = generate([tokens], model, max_tokens=64, temperature=0.0, eos_id=tokenizer.instruct_tokenizer.tokenizer.eos_id)
result = tokenizer.instruct_tokenizer.tokenizer.decode(out_tokens[0])

print(result)

💻 transformers での生成

Hugging Face の transformers を使用してテキストを生成する場合は、次のようにできます。

from transformers import pipeline

messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]
chatbot = pipeline("text-generation", model="mistralai/Mistral-7B-Instruct-v0.3")
chatbot(messages)

💻 transformers での関数呼び出し

この例を使用するには、transformers バージョン 4.42.0 以上が必要です。詳細については、関数呼び出しガイドを参照してください。

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

model_id = "mistralai/Mistral-7B-Instruct-v0.3"
tokenizer = AutoTokenizer.from_pretrained(model_id)

def get_current_weather(location: str, format: str):
    """
    Get the current weather

    Args:
        location: The city and state, e.g. San Francisco, CA
        format: The temperature unit to use. Infer this from the users location. (choices: ["celsius", "fahrenheit"])
    """
    pass

conversation = [{"role": "user", "content": "What's the weather like in Paris?"}]
tools = [get_current_weather]


# format and tokenize the tool use prompt 
inputs = tokenizer.apply_chat_template(
            conversation,
            tools=tools,
            add_generation_prompt=True,
            return_dict=True,
            return_tensors="pt",
)

model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.bfloat16, device_map="auto")

inputs.to(model.device)
outputs = model.generate(**inputs, max_new_tokens=1000)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

なお、スペースの関係で、この例ではツールを呼び出し、ツール呼び出しとツール結果をチャット履歴に追加して、モデルが次の生成でそれらを使用できるようにする完全なサイクルは示されていません。完全なツール呼び出しの例については、関数呼び出しガイドを参照してください。また、Mistral はツール呼び出し ID を使用するため、ツール呼び出しとツール結果にこれらを含める必要があります。これらは正確に 9 文字の英数字でなければなりません。

⚠️ 制限事項

Mistral 7B Instruct モデルは、ベースモデルを簡単にファインチューニングして魅力的なパフォーマンスを達成できることをすばやく実証するものです。このモデルにはモデレーションメカニズムがありません。モデルがガードレールをきめ細かく尊重し、モデレートされた出力が必要な環境でのデプロイを可能にする方法について、コミュニティと協力することを楽しみにしています。

👥 Mistral AI チーム

Albert Jiang, Alexandre Sablayrolles, Alexis Tacnet, Antoine Roux, Arthur Mensch, Audrey Herblin-Stoop, Baptiste Bout, Baudouin de Monicault, Blanche Savary, Bam4d, Caroline Feldman, Devendra Singh Chaplot, Diego de las Casas, Eleonore Arcelin, Emma Bou Hanna, Etienne Metzger, Gianna Lengyel, Guillaume Bour, Guillaume Lample, Harizo Rajaona, Jean-Malo Delignon, Jia Li, Justus Murke, Louis Martin, Louis Ternon, Lucile Saulnier, Lélio Renard Lavaud, Margaret Jennings, Marie Pellat, Marie Torelli, Marie-Anne Lachaux, Nicolas Schuhl, Patrick von Platen, Pierre Stock, Sandeep Subramanian, Sophia Yang, Szymon Antoniak, Teven Le Scao, Thibaut Lavril, Timothée Lacroix, Théophile Gervet, Thomas Wang, Valera Nemychnikova, William El Sayed, William Marshall