🚀 Blake-XTM-Arc-3B-V1のGGUFファイル
これらはFlexan/Blake-XTM-Arc-3B-V1のGGUFファイルです。
🚀 クイックスタート
Blake-XTM Arc 3B (V1)は、テキスト生成に使用される30億パラメータの大規模言語モデルです。推論やツール呼び出しが可能なように学習されています。
✨ 主な機能
- 推論能力を備えた30億パラメータの大規模言語モデル。
- 必要に応じてツールを呼び出すことができます。
- ChatML形式を使用した会話対応。
📚 ドキュメント
モデル詳細
モデル説明
Blake-XTM Arc 3B (V1)は、思考し、必要に応じてツールを呼び出すように学習された30億パラメータの命令型LLMです。アシスタントメッセージごとに1つのツールのみを使用することができます(並列ツール呼び出しはサポートされていません)。このモデルは、microsoft/phi-2をベースモデルとしてLoRA微調整されています。
チャット形式
Blake-XTM Arc 3B (V1)はChatML形式を使用します。例えば:
<|im_start|>system
システムメッセージ<|im_end|>
<|im_start|>user
ユーザーのプロンプト<|im_end|>
<|im_start|>assistant
アシスタントの応答<|im_end|>
モデルの使用方法
アシスタントの応答は、以下の3つの形式をとることができます(内容は例であり、モデルから生成されたものではありません):
- 単なる応答:
<|im_start|>assistant
こんにちは!今日はどのようにお手伝いできますか?<|im_end|>
- 思考プロセスと応答:
<|im_start|>assistant
<|think_start|>ユーザーは簡単なメッセージで私に挨拶しました。どのように応答するか考える必要があります。
ユーザーが簡単な挨拶を送ったので、彼らのエネルギーに合った挨拶で返信する必要があります。
よし、「こんにちは!どのようにお手伝いできますか?」のようなメッセージで返信できます。<|think_end|>
こんにちは!今日はどのようにお手伝いできますか?<|im_end|>
- 思考プロセスとツール呼び出し:
<|im_start|>assistant
<|think_start|>ユーザーは私にパリ近郊のすべてのレストランを見つけるように依頼しました。ええと...よく考えてみましょう。
私には'find_restaurants'という利用可能なツールがあることがわかります。これをこの目的に使用できるかもしれません。
よし、私は`find_restaurants`ツールを使用してパリ近郊のレストランを見つけるべきだと思います。`city`パラメータには'パリ'を使用し、`country`パラメータには`フランス`を入力します。
よし、今すぐツール呼び出しを行うことができます。<|think_end|>
<|tool_start|>{'name': 'find_restaurants', 'arguments': {'city': 'パリ', 'country': 'フランス'}}<|tool_end|><|im_end|>
状況に応じて、以下のシステムプロンプトの使用をお勧めします:
- 思考プロセスのみ:
あなたは高度な推論モデルです。
<|think_start|>...<|think_end|>タグの間で思考します。ユーザーの要求が数学や論理的思考/推論を含む場合は、必ず思考する必要があります。
- 思考プロセスとツール呼び出し:
あなたはツール呼び出し機能を備えた高度な推論モデルです。
<|think_start|>...<|think_end|>タグの間で思考します。ユーザーの要求が数学、論理的思考/推論を含む場合、またはツールを使用することを検討する場合は、必ず思考する必要があります。
# ツール
あなたは以下のツールにアクセスできます:
[{'type': 'function', 'function': {'name': 'convert_currency', 'description': '通貨を1つのタイプから別のタイプに変換する', 'parameters': {'type': 'object', 'properties': {'amount': {'type': 'number', 'description': '変換する金額'}, 'from_currency': {'type': 'string', 'description': '変換元の通貨'}, 'to_currency': {'type': 'string', 'description': '変換先の通貨'}}, 'required': ['amount', 'from_currency', 'to_currency']}}}, {'type': 'function', 'function': {'name': 'get_random_joke', 'description': 'ランダムなジョークを取得する', 'parameters': {'type': 'object', 'properties': {}, 'required': []}}}] <\/tools>各ツール呼び出しには、次のpydanticモデルJSONスキーマを使用します: {'title': 'FunctionCall', 'type': 'object', 'properties': {'arguments': {'title': 'Arguments', 'type': 'object'}, 'name': {'title': 'Name', 'type': 'string'}}, 'required': ['arguments', 'name']}
ツールを呼び出すには、<|tool_start|>...<|tool_end|>内に名前と引数を含むJSONオブジェクトを記述します。
ツールの応答を返す場合は、tool
ユーザーとしてメッセージを送信することができます:
<|im_start|>assistant
<|think_start|>ユーザーは私にパリ近郊のすべてのレストランを見つけるように依頼しました。ええと...よく考えてみましょう。
私には'find_restaurants'という利用可能なツールがあることがわかります。これをこの目的に使用できるかもしれません。
よし、私は`find_restaurants`ツールを使用してパリ近郊のレストランを見つけるべきだと思います。`city`パラメータには'パリ'を使用し、`country`パラメータには`フランス`を入力します。
よし、今すぐツール呼び出しを行うことができます。<|think_end|>
<|tool_start|>{'name': 'find_restaurants', 'arguments': {'city': 'パリ', 'country': 'フランス'}}<|tool_end|><|im_end|>
<|im_start|>tool
{'restaurants': [{'name': 'レストラン名', 'rating': 4.5}]}<|im_end|>
📄 ライセンス
このモデルはCC BY-SA 4.0ライセンスの下で提供されています。
🔧 技術詳細
モデル情報
属性 |
詳情 |
モデルタイプ |
30億パラメータの大規模言語モデル |
訓練データ |
- PJMixers-Dev/dolphin-deepseek-1k-think-1k-response-filtered-ShareGPT - Jofthomas/hermes-function-calling-thinking-V1 |
ベースモデル |
microsoft/phi-2 |
パイプラインタグ |
テキスト生成 |