TinyMistral-248M - Chat - v4オープンソースチャットモデル - マルチラウンドダイアログに対応し、様々なシナリオに適用可能

ホーム

Tinymistral 248M Chat V4

Felladrinによって開発

TinyMistral-248M-ChatはTinyMistral-248Mをファインチューニングした対話モデルで、マルチターン対話をサポートし、様々な対話シナリオに適しています。

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #軽量級対話モデル #多分野知識QA #ChatMLフォーマット対応

ダウンロード数 516

リリース時間 : 11/16/2023

モデル概要

これは軽量級の対話モデルで、TinyMistral-248Mをベースにファインチューニングされており、多様な対話タスクをサポートし、ユーザーの質問を理解して応答できます。

モデル特徴

軽量モデル

わずか2億4800万パラメータで、リソースが限られた環境に適しています。

マルチターン対話サポート

複雑なマルチターン対話シナリオを処理できます。

複数データセット学習

ultrachat_200kやOpenOrcaなど、複数の高品質データセットを使用して学習しています。

DPOファインチューニング

DPOファインチューニングにより、対話品質が向上しています。

モデル能力

テキスト生成

マルチターン対話

QAシステム

クリエイティブライティング

使用事例

対話システム

カスタマーサポートボット

顧客の問い合わせや問題解決に使用します。

正確で友好的な回答を提供できます。

パーソナルアシスタント

ユーザーの日常タスクを支援し、情報を提供します。

ユーザーのニーズを理解し、対応できます。

教育

学習アシスタント

学生の学習中の質問に答えます。

明確で正確な学習アドバイスを提供できます。

🚀 TinyMistral-248M-Chat

TinyMistral-248M-Chatは、特定のデータセットで訓練されたテキスト生成モデルです。高度な知識と親切なアシスタントとして、ユーザーの質問に明確に応答します。

🚀 クイックスタート

TinyMistral-248M-Chatを使用するには、以下の手順に従ってください。

推奨プロンプトフォーマット

<|im_start|>system
{system_message}<|im_end|>
<|im_start|>user
{user_message}<|im_end|>
<|im_start|>assistant

✨ 主な機能

特定のベースモデルと追加の特殊トークンを使用しています。
複数のデータセットで訓練されており、幅広い知識を持っています。
特定のハイパーパラメータで訓練され、高性能を発揮します。

📦 インストール

このモデルを使用するには、transformersライブラリが必要です。以下のコマンドでインストールできます。

pip install transformers torch

💻 使用例

基本的な使用法

from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
import torch

model_path = "Felladrin/TinyMistral-248M-Chat-v4"
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForCausalLM.from_pretrained(model_path).to(device)
streamer = TextStreamer(tokenizer)
messages = [
    {
        "role": "system",
        "content": "You are a highly knowledgeable and friendly assistant. Your goal is to understand and respond to user inquiries with clarity. Your interactions are always respectful, helpful, and focused on delivering the most accurate information to the user.",
    },
    {
        "role": "user",
        "content": "Hey! Got a question for you!",
    },
    {
        "role": "assistant",
        "content": "Sure! What's it?",
    },
    {
        "role": "user",
        "content": "What are some potential applications for quantum computing?",
    },
]
prompt = tokenizer.apply_chat_template(
    messages, tokenize=False, add_generation_prompt=True
)
inputs = tokenizer(prompt, return_tensors="pt").to(device)
model.generate(
    inputs.input_ids,
    attention_mask=inputs.attention_mask,
    max_length=tokenizer.model_max_length,
    streamer=streamer,
    eos_token_id=tokenizer.eos_token_id,
    pad_token_id=tokenizer.pad_token_id,
    do_sample=True,
    temperature=0.6,
    top_p=0.8,
    top_k=0,
    min_p=0.1,
    typical_p=0.2,
    repetition_penalty=1.176,
)

📚 ドキュメント

モデル情報

属性	详情
モデルタイプ	テキスト生成モデル
訓練データ	- [ChatML] HuggingFaceH4/ultrachat_200k - [ChatML] Open-Orca/OpenOrca - [ChatML] hkust-nlp/deita-10k-v0 - [ChatML] LDJnr/Capybara - [ChatML] databricks/databricks-dolly-15k - [ChatML] euclaise/reddit-instruct-curated - [ChatML] CohereForAI/aya_dataset - HuggingFaceH4/ultrafeedback_binarized
ベースモデル	Locutusque/TinyMistral-248M
ライセンス	Apache License 2.0

訓練方法

このモデルは、SFTTrainerを使用して以下の設定で訓練されました。

ハイパーパラメータ	値
学習率	2e-5
総トレーニングバッチサイズ	32
最大シーケンス長	2048
重み減衰	0.01
ウォームアップ比率	0.1
NEFTuneノイズアルファ	5
オプティマイザ	Adam with betas=(0.9,0.999) and epsilon=1e-08
スケジューラ	cosine
シード	42

その後、LLaMA-Factoryを通じてDPOでファインチューニングされました。

パラメータ	値
データセット	HuggingFaceH4/ultrafeedback_binarized
学習率	1e-06
トレーニングバッチサイズ	4
評価バッチサイズ	8
シード	42
分散タイプ	multi-GPU
デバイス数	8
勾配累積ステップ	4
総トレーニングバッチサイズ	128
総評価バッチサイズ	64
オプティマイザ	adamw_8bit with betas=(0.9,0.999) and epsilon=1e-08
LRスケジューラタイプ	cosine
LRスケジューラウォームアップ比率	0.1
エポック数	2.0

以下のコマンドでファインチューニングを行いました。

llamafactory-cli train \
    --stage dpo \
    --do_train True \
    --model_name_or_path ~/TinyMistral-248M-Chat \
    --preprocessing_num_workers $(python -c "import os; print(max(1, os.cpu_count() - 2))") \
    --dataloader_num_workers $(python -c "import os; print(max(1, os.cpu_count() - 2))") \
    --finetuning_type full \
    --flash_attn auto \
    --enable_liger_kernel True \
    --dataset_dir data \
    --dataset ultrafeedback \
    --cutoff_len 1024 \
    --learning_rate 1e-6 \
    --num_train_epochs 2.0 \
    --per_device_train_batch_size 4 \
    --gradient_accumulation_steps 4 \
    --lr_scheduler_type linear \
    --max_grad_norm 1.0 \
    --logging_steps 10 \
    --save_steps 50 \
    --save_total_limit 1 \
    --warmup_ratio 0.1 \
    --packing False \
    --report_to tensorboard \
    --output_dir ~/TinyMistral-248M-Chat-v4 \
    --pure_bf16 True \
    --plot_loss True \
    --trust_remote_code True \
    --ddp_timeout 180000000 \
    --include_tokens_per_second True \
    --include_num_input_tokens_seen True \
    --optim adamw_8bit \
    --pref_beta 0.5 \
    --pref_ftx 0 \
    --pref_loss simpo \
    --gradient_checkpointing True