Jamba-v0.1-chat-multilingualオープンソースチャットモデル - 多言語でのスムーズな対話交流をサポート

ホーム

Jamba V0.1 Chat Multilingual

lightblueによって開発

ai21labs/Jamba-v0.1をファインチューニングしたチャットボットモデルで、多言語対話をサポートし、数時間のQLoRAファインチューニングを経て、英語やその他の言語で合理的で流暢な対話が可能です。

大規模言語モデル

Transformers

オープンソースライセンス:Apache-2.0 #256K超長コンテキスト #多言語対話 #QLoRA効率的なファインチューニング

ダウンロード数 22

リリース時間 : 3/30/2024

モデル概要

このモデルは、Jambaモデルをチャットボットとしてファインチューニングする方法を探るための小規模な実験的トレーニングプロジェクトです。予備テストでは、このモデルが英語や他の言語で合理的で流暢な対話ができることが示されています。

モデル特徴

多言語サポート

モデルは英語、日本語、ポーランド語など、複数の言語で対話が可能です。

長いコンテキスト処理

256Kまでの長いコンテキスト長をサポートし、長い対話や複雑なタスクに適しています。

迅速なファインチューニング

わずか数時間のQLoRAファインチューニングで良好な対話能力が得られます。

システムメッセージ制御

システムメッセージを通じて、回答スタイルや言語の難易度など、モデルの動作を簡単に導くことができます。

モデル能力

テキスト生成

多言語対話

システムメッセージ誘導

マルチターン対話

使用事例

チャットボット

英語対話

モデルは流暢な英語対話が可能で、さまざまな質問に答えます。

回答は合理的で流暢ですが、特定の分野では幻覚的な誤情報が発生する可能性があります。

多言語対話

モデルはプロンプト言語で応答でき、複数の言語をサポートします。

テストでは、モデルがプロンプト言語で比較的信頼性高く応答できることが示されています。

システムメッセージ制御

システムメッセージを使用して、モデルの回答スタイル（簡潔な英語、複雑な英語、韻を踏んだ回答など）を制御できます。

効果はまちまちですが、基本的には期待通りの効果が得られます。

情報検索

事実検索

さまざまなトピックに関する事実質問に答えます。

特定の分野では優れたパフォーマンスを示しますが、他の分野では誤情報が発生する可能性があります。

🚀 トランスフォーマーモデル

このモデルは、ai21labs/Jamba-v0.1 をチャットボットとして微調整するのがどれほど簡単かを判断するための小規模実験として学習されました。この実験の目的は、QLoRAで数時間だけ微調整した場合、Jambaが英語と他の言語でどれほど賢く、信頼性高くチャットできるかを見つけることです。初期の主観的なテストでは、このモデルが英語と他の言語の両方でかなり良好にチャットできることが示されています。ぜひ試してみてください！

🚀 クイックスタート

このモデルを使用するには、まず必要なライブラリをインストールする必要があります。その後、コード例を参考にモデルを実行できます。

✨ 主な機能

英語と他の言語でのチャットが可能。
システムメッセージを使用してモデルの応答を制御できる。
多ターンの会話にも対応している。

📦 インストール

Jambaを使用するには、transformers バージョン4.39.0以上が必要です。

pip install transformers>=4.39.0

最適化されたMamba実装を実行するには、まず mamba-ssm と causal-conv1d をインストールする必要があります。

pip install mamba-ssm causal-conv1d>=1.2.0

また、モデルをCUDAデバイス上で実行する必要があります。最適化されたMambaカーネルを使用せずにモデルを実行することもできますが、レイテンシが大幅に増加するため、推奨されません。その場合は、モデルをロードする際に use_mamba_kernels=False を指定する必要があります。

💻 使用例

基本的な使用法

# ※ - このコードは、すべての入力に "<|startoftext|>" 特殊トークンを自動的に追加します。
# すべての入力にこれを追加することは推論に必要です。初期テストでは、これを省略すると出力エラーが発生することが示されています。
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
import torch

double_quant_config = BitsAndBytesConfig(
   load_in_4bit=True,
   bnb_4bit_use_double_quant=True,
   bnb_4bit_compute_dtype=torch.float16
)

model = AutoModelForCausalLM.from_pretrained("lightblue/Jamba-v0.1-chat-multilingual", device_map="auto", quantization_config=double_quant_config, trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained("lightblue/Jamba-v0.1-chat-multilingual")

input_text = """<|im_start|>system 
You are a helpful AI assistant.
<|im_end|> 
<|im_start|>user
What is the most interesting fact about kangaroos that you know?
<|im_end|> 
<|im_start|>assistant
"""

input_ids = tokenizer(input_text, return_tensors='pt').to(model.device)["input_ids"]

outputs = model.generate(input_ids, max_new_tokens=256, temperature=0.0, repetition_penalty=1.1)

print(tokenizer.batch_decode(outputs)[0])
# <|startoftext|><|im_start|>system 
# You are a helpful AI assistant.
# <|im_end|> 
# <|im_start|>user
# What is the most interesting fact about kangaroos that you know?
# <|im_end|> 
# <|im_start|>assistant
# One of the most interesting facts about kangaroos is their unique reproductive system, which involves embryonic diapause and multiple births. Female kangaroos can have up to three joeys at different stages of development simultaneously: one fully developed in the pouch, another developing inside her body, and an embryo waiting for its turn.<|im_end|>
# <|endoftext|>

📚 ドキュメント

初期テスト結果

全体的に、このモデルは一部の領域で適切な知識を持っている一方で、他の領域では誤った情報を生成することがあります。また、システムメッセージを使用してモデルを制御するのは比較的簡単で、韻を踏んだり、英語の難易度を調整したりすることもできます。多ターンの精度は、ごく少量のテストでは適切であるように見えます。多言語テストでは、このモデルが提示された言語でかなり信頼性高く応答することが示されています。

トレーニング詳細

このモデルは、2つのオープンソースデータセット（1つは多言語）を使用して、A100（80GB）x 4環境で1エポック、3時間学習されました。

トレーニングデータ

jondurbin/airoboros-3.2 英語のLLMタスクが約59Kの例で構成されたデータセットで、主にGPT - 4で生成されています。このデータセットは、世界で最も優れたパフォーマンスを持つオープンソースLLMのいくつか（例：jondurbin/bagel-7b-v0.4、NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO）によって使用されており、さまざまなタスクを含んでいるため、多面的で正確なモデルにつながると仮定しました。このため、トレーニングデータの大部分にこのデータセットを選択しました。なお、jondurbin/airoboros-3.2の各要素にはすでにシステムメッセージが含まれています。
openchat/openchat_sharegpt4_dataset （GPT - 4の応答のみ）ユーザーとGPT - 4の間の多言語の多ターンチャットが約6Kの例で構成されたデータセットです。jondurbin/airoboros-3.2は以前のモデルで良好な結果をもたらしていますが、残念ながら多言語データがほとんど含まれていません。私たちは日本のAI企業であるため、LLMが日本語でも出力できる必要があります。そのため、ShareGPTデータセットから多くの言語のGPT - 4の応答の小規模で質の高いデータセットも選択しました。トレーニングの効率を最大化するために、データセットをできるだけ小規模で高品質に保ちたかったので、GPT - 4の応答のみを選択しました。なお、openchat/openchat_sharegpt4_datasetにはシステムメッセージが含まれていないため、「You are GPT - 4, a helpful assistant.」をシステムメッセージとして追加しました。

データ準備コード

import os
import pandas as pd
from datasets import load_dataset, Dataset, concatenate_datasets

os.environ['HF_HOME'] = "/workspace/hf_home"
os.environ['HF_HUB_ENABLE_HF_TRANSFER'] = "1"

boros_dataset = load_dataset("jondurbin/airoboros-3.2", split='train')

gpt4_df = pd.read_json("https://huggingface.co/datasets/openchat/openchat_sharegpt4_dataset/resolve/main/sharegpt_gpt4.json?download=true")
gpt4_df["conversations"] = gpt4_df["items"].apply(lambda x: [{'from': 'system', 'value': 'You are GPT-4, a helpful assistant.'}] + x)

gpt4_dataset = Dataset.from_pandas(gpt4_df[["conversations"]])

dataset = concatenate_datasets([gpt4_dataset, boros_dataset]).shuffle()

dataset.select_columns(["conversations"]).to_json("/workspace/airoboros-3.2_plus_openchat_sharegp