Mistral-7B-Instruct-v0.2オープンソース大規模言語モデル - 30%の疎通化で再トレーニング不要で高性能

ホーム

Mistral 7B Instruct V0.2 Sparsity 30 V0.1

wang7776によって開発

Mistral-7B-Instruct-v0.2はMistral-7B-Instruct-v0.1を強化した命令微調整大規模言語モデルで、Wanda枝刈り手法により30%のスパース化を実現し、再訓練不要で競争力のある性能を維持します。

大規模言語モデル

Transformers

オープンソースライセンス:Apache-2.0 #命令微調整最適化 #再訓練不要の枝刈り #会話テンプレート対応

ダウンロード数 75

リリース時間 : 1/17/2024

モデル概要

これは命令微調整された大規模言語モデルで、会話と命令追従能力を最適化しており、自然言語理解と生成が必要なシナリオに適しています。

モデル特徴

Wanda枝刈り技術

Wanda枝刈り手法により30%のスパース化を実現し、再訓練や重み更新不要で競争力のある性能を維持

強化された命令微調整

v0.1版と比較して命令微調整を強化し、会話と命令追従能力を最適化

効率的な注意機構

グループ化クエリ注意とスライディングウィンドウ注意機構を採用し、計算効率を向上

モデル能力

自然言語理解

テキスト生成

対話システム

命令追従

使用事例

対話システム

インテリジェントアシスタント

ユーザークエリを理解し応答するスマート対話アシスタントの構築

自然で流暢な対話応答を生成可能

コンテンツ生成

クリエイティブライティング

物語、詩などの創造的なテキストコンテンツの生成

🚀 Mistral-7B-Instruct-v0.2 モデル

このモデルは、自然言語処理におけるテキスト生成タスクに特化しており、Wanda 剪定手法を用いて 30% の疎度まで剪定されています。この手法では再学習や重みの更新を必要とせず、依然として競争力のある性能を達成します。ベースモデルへのリンクはこちらから確認できます。

🚀 クイックスタート

このモデルは、自然言語処理におけるテキスト生成タスクに特化した大規模言語モデルです。以下に、基本的な使用方法を説明します。

✨ 主な機能

Wanda 剪定手法を用いて 30% の疎度まで剪定されている。
再学習や重みの更新を必要とせず、競争力のある性能を達成する。
指示に基づいた微調整が行われており、特定のタスクに対する性能が向上している。

📚 ドキュメント

モデル概要

Mistral-7B-Instruct-v0.2 大規模言語モデル (LLM) は、Mistral-7B-Instruct-v0.1 の指示に基づいた微調整版です。このモデルの詳細については、論文とリリースブログ記事をご覧ください。

指示フォーマット

指示に基づいた微調整を利用するためには、プロンプトを [INST] と [/INST] トークンで囲む必要があります。最初の指示は文頭識別子で始める必要があり、次の指示はその必要はありません。アシスタントの生成は文末識別子で終了します。

例:

text = "<s>[INST] What is your favourite condiment? [/INST]"
"Well, I'm quite partial to a good squeeze of fresh lemon juice. It adds just the right amount of zesty flavour to whatever I'm cooking up in the kitchen!</s> "
"[INST] Do you have mayonnaise recipes? [/INST]"

このフォーマットは、apply_chat_template() メソッドを介してチャットテンプレートとして利用できます。

from transformers import AutoModelForCausalLM, AutoTokenizer

device = "cuda" # the device to load the model onto

model = AutoModelForCausalLM.from_pretrained("mistralai/Mistral-7B-Instruct-v0.2")
tokenizer = AutoTokenizer.from_pretrained("mistralai/Mistral-7B-Instruct-v0.2")

messages = [
    {"role": "user", "content": "What is your favourite condiment?"},
    {"role": "assistant", "content": "Well, I'm quite partial to a good squeeze of fresh lemon juice. It adds just the right amount of zesty flavour to whatever I'm cooking up in the kitchen!"},
    {"role": "user", "content": "Do you have mayonnaise recipes?"}
]

encodeds = tokenizer.apply_chat_template(messages, return_tensors="pt")

model_inputs = encodeds.to(device)
model.to(device)

generated_ids = model.generate(model_inputs, max_new_tokens=1000, do_sample=True)
decoded = tokenizer.batch_decode(generated_ids)
print(decoded[0])

モデルアーキテクチャ

この指示モデルは、Mistral-7B-v0.1 をベースにしており、以下のアーキテクチャが選択されています。

Grouped-Query Attention
Sliding-Window Attention
Byte-fallback BPE tokenizer

トラブルシューティング

以下のエラーが表示された場合:

Traceback (most recent call last):
File "", line 1, in
File "/transformers/models/auto/auto_factory.py", line 482, in from_pretrained
config, kwargs = AutoConfig.from_pretrained(
File "/transformers/models/auto/configuration_auto.py", line 1022, in from_pretrained
config_class = CONFIG_MAPPING[config_dict["model_type"]]
File "/transformers/models/auto/configuration_auto.py", line 723, in getitem
raise KeyError(key)
KeyError: 'mistral'

ソースから transformers をインストールすることで問題が解決するはずです。

pip install git+https://github.com/huggingface/transformers

これは transformers-v4.33.4 以降では必要ないはずです。

制限事項

Mistral 7B Instruct モデルは、ベースモデルを簡単に微調整して魅力的な性能を達成できることを迅速に実証するためのものです。このモデルにはモデレーション機構がありません。私たちは、モデルがガードレールをきめ細かく尊重し、モデレーションされた出力を必要とする環境でのデプロイを可能にする方法について、コミュニティと協力することを期待しています。

開発チーム

Albert Jiang, Alexandre Sablayrolles, Arthur Mensch, Blanche Savary, Chris Bamford, Devendra Singh Chaplot, Diego de las Casas, Emma Bou Hanna, Florian Bressand, Gianna Lengyel, Guillaume Bour, Guillaume Lample, Lélio Renard Lavaud, Louis Ternon, Lucile Saulnier, Marie - Anne Lachaux, Pierre Stock, Teven Le Scao, Théophile Gervet, Thibaut Lavril, Thomas Wang, Timothée Lacroix, William El Sayed.