llama-3-youko-8b-instructオープンソースモデル - 日本語と英語の両方の指令をサポートし、無料でインテリジェントな対話を実現

ホーム

Llama 3 Youko 8b Instruct

rinnaによって開発

Llama-3をベースにした日本語と英語の指令チューニングモデルで、SFT、チャットベクトル、DPO技術を融合しています。

大規模言語モデル

Transformers

複数言語対応#日本語指令最適化 #多技術融合チューニング #日英バイリンガル対応

ダウンロード数 852

リリース時間 : 7/21/2024

モデル概要

このモデルはrinna/llama-3-youko-8bの指令チューニング版で、教師付き微調整(SFT)、チャットベクトル、直接嗜好最適化(DPO)技術を採用し、指令により正確に応答でき、日本語と英語をサポートします。

モデル特徴

多技術融合チューニング

教師付き微調整(SFT)、チャットベクトル、直接嗜好最適化(DPO)技術を組み合わせて、指令追従能力を向上させます。

多言語対応

日本語と英語をサポートし、異なる言語シーンに適しています。

多データセット訓練

複数の公開データセットとrinna独自のデータセットを使用して訓練し、モデルの汎化能力を向上させます。

Llama-3チャット形式

Llama-3チャット形式を採用し、指令により正確に応答できます。

モデル能力

日本語テキスト生成

英語テキスト生成

指令追従

対話システム

使用事例

スマートアシスタント

日本語質問応答システム

日本語のスマート質問応答アシスタントを構築するために使用されます。

日本の文化、歴史などに関する質問に正確に答えることができます。

多言語アプリケーション

多言語チャットボット

日本語と英語をサポートするチャットボットを構築します。

🚀 `Llama 3 Youko 8B Instruct (rinna/llama-3-youko-8b-instruct)`

このモデルは、rinna/llama-3-youko-8bを教師付き微調整（SFT）、Chat Vector、直接的嗜好最適化（DPO）を用いて命令調整したバージョンです。Llama-3のチャット形式を採用しています。

rinna-icon

🚀 クイックスタート

このモデルは、Llama 3 Youko 8Bをベースにした命令調整済みモデルです。以下のセクションで、モデルの概要、ベンチマーク、使用方法、トークナイゼーション、引用方法、参考文献、ライセンスについて説明します。

✨ 主な機能

教師付き微調整（SFT）、Chat Vector、直接的嗜好最適化（DPO）を用いた命令調整
Llama-3のチャット形式を採用
複数のデータセットを用いた学習

📚 ドキュメント

概要

サイズ	継続的事前学習	命令調整
8B	Llama 3 Youko 8B [HF] [GPTQ]	Llama 3 Youko 8B Instruct [HF] [GPTQ]
70B	Llama 3 Youko 70B [HF] [GPTQ]	Llama 3 Youko 70B Instruct [HF] [GPTQ]

モデルアーキテクチャ

32層、隠れ層サイズ4096のTransformerベースの言語モデルです。アーキテクチャの詳細については、Llama 3 Model Cardを参照してください。

学習: Meta Llama 3を使用して構築

教師付き微調整。教師付き微調整データは、以下のデータセットのサブセットです。

CohereForAI/aya_dataset
- JPNサブセットが使用されました。
FLAN
kunishou/databricks-dolly-15k-ja
kunishou/hh-rlhf-49k-ja
kunishou/oasst1-chat-44k-ja
kunishou/oasst2-chat-68k-ja
meta-math/MetaMathQA
- 以下のセクションが使用されました：MATH_AnsAug、MATH_Rephrased、MATH_SV、およびMATH_FOBAR。
- 一般的に使用される評価コーパスからの拡張データを含む残りのセクションは、データリークの可能性を防ぐためにスキップされました。
OpenAssistant/oasst1
- ENおよびJAサブセットが使用されました。
OpenAssistant/oasst2
- ENおよびJAサブセットが使用されました。
sahil2801/CodeAlpaca-20k
rinnaデータセット

モデルマージ。微調整されたモデル（llama-3-youko-8b-sft）は、以下のチャットベクトルの追加によって強化されています。チャットベクトルは、meta-llama/Meta-Llama-3-8Bのパラメータベクトルからmeta-llama/Meta-Llama-3-8B-Instructのパラメータベクトルを減算することで取得されました。

llama-3-youko-8b-sft + 0.5 * (meta-llama/Meta-Llama-3-8B-Instruct - meta-llama/Meta-Llama-3-8B)

ここで、パラメータベクトルの減算および加算時に埋め込み層はスキップされました。

直接的嗜好最適化 が、以下のデータセットのサブセットを使用してこの命令モデルを構築するために適用されました。

貢献者

リリース日

2024年7月25日

ベンチマーク

rinnaのLMベンチマークページ（シート20240725）を参照してください。

トークナイゼーション

このモデルは、元のmeta-llama/Meta-Llama-3-8B-Instructトークナイザーを使用しています。

引用方法

@misc{rinna-llama-3-youko-8b-instruct,
    title = {rinna/llama-3-youko-8b-instruct},
    author = {Chen, Xinqi and Mitsuda, Koh and Wakatsuki, Toshiaki and Sawada, Kei},
    url = {https://huggingface.co/rinna/llama-3-youko-8b-instruct}
}

@inproceedings{sawada2024release,
    title = {Release of Pre-Trained Models for the {J}apanese Language},
    author = {Sawada, Kei and Zhao, Tianyu and Shing, Makoto and Mitsui, Kentaro and Kaga, Akio and Hono, Yukiya and Wakatsuki, Toshiaki and Mitsuda, Koh},
    booktitle = {Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024)},
    month = {5},
    year = {2024},
    pages = {13898--13905},
    url = {https://aclanthology.org/2024.lrec-main.1213},
    note = {\url{https://arxiv.org/abs/2404.01657}}
}

参考文献

@article{llama3modelcard,
    title = {Llama 3 Model Card},
    author = {AI@Meta},
    year = {2024},
    url = {https://github.com/meta-llama/llama3/blob/main/MODEL_CARD.md}
}

@article{huang2023chat,
    title = {Chat Vector: A Simple Approach to Equip LLMs with Instruction Following and Model Alignment in New Languages},
    author = {Huang, Shih-Cheng and Li, Pin-Zu and Hsu, Yu-Chi and Chen, Kuang-Ming and Lin, Yu Tung and Hsiao, Shih-Kai and Tzong-Han Tsai, Richard and Lee, Hung-yi},
    year = {2023},
    url = {https://arxiv.org/abs/2310.04799}
}

💻 使用例

基本的な使用法

この命令調整済みモデルは、ベースモデルよりも繰り返しテキストを生成する傾向があるため、生成性能を向上させるためにrepetition_penalty=1.1を設定しています。前述の評価実験でも、同じ繰り返しペナルティが命令調整済みモデルに適用されています。

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

model_id = "rinna/llama-3-youko-8b-instruct"

tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)

messages = [
    {"role": "system", "content": "あなたは誠実で優秀なアシスタントです。どうか、簡潔かつ正直に答えてください。"},
    {"role": "user", "content": "西田幾多郎とはどんな人物ですか？"},
]

input_ids = tokenizer.apply_chat_template(
    messages,
    add_generation_prompt=True,
    return_tensors="pt"
).to(model.device)

terminators = [
    tokenizer.convert_tokens_to_ids("<|end_of_text|>"),
    tokenizer.convert_tokens_to_ids("<|eot_id|>")
]

outputs = model.generate(
    input_ids,
    max_new_tokens=512,
    eos_token_id=terminators,
    do_sample=True,
    temperature=0.6,
    top_p=0.9,
    repetition_penalty=1.1,
)

response = outputs[0][input_ids.shape[-1]:]
response = tokenizer.decode(response, skip_special_tokens=True)
print(response)