Llama-3-8B-Instruct-Ja開源模型 - 免費商用，支持日語問答與對話

首頁

Llama 3 8B Instruct Ja

由alfredplpl開發

針對Llama 3進行日語化的模型，允許商業用途，支持日語問答和對話

大型語言模型

Transformers

支持多種語言開源協議:其他 #日語指令微調 #多輪對話優化 #商業可用

下載量 78

發布時間 : 4/22/2024

模型概述

基於Meta-Llama-3-8B-Instruct進行日語優化的語言模型，專門針對日語問答和對話任務進行了微調

模型特點

日語優化

專門針對日語進行了指令微調，能夠流暢地進行日語問答和對話

商業用途許可

遵循Llama 3許可證，允許商業用途

高效訓練

採用LoRA微調方法，在有限計算資源下實現高效訓練

模型能力

日語文本生成

日語問答系統

多輪對話

指令跟隨

使用案例

客戶服務

日語客服助手

用於處理日語客戶的諮詢和問題解答

能夠理解並流暢回答日語客戶的問題

教育

日語學習助手

幫助日語學習者練習對話和回答問題

提供自然的日語對話體驗

🚀 面向日語的Llama 3 8B

本項目旨在將Llama 3模型進行日語適配。項目於4月23日更新，建議您重新下載使用。

🚀 快速開始

若想快速體驗，可使用演示。其次，推薦使用Colab。若要在本地運行，請按以下步驟操作：

📦 安裝指南

首先，安裝所需庫：

pip install -U transformers accelerate

💻 使用示例

基礎用法

安裝完成後，運行以下代碼：

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("alfredplpl/Llama-3-8B-Instruct-Ja")
model = AutoModelForCausalLM.from_pretrained("alfredplpl/Llama-3-8B-Instruct-Ja", device_map="auto", torch_dtype=torch.bfloat16)

# プロンプトの準備
messages = [
    {
        'role': "system",
        'content': "あなたは日本語で回答するAIアシスタントです。"
    },
    {
        'role': "user",
        'content': "貓と犬、どっちが好き？"
    }
]
prompt=tokenizer.apply_chat_template(messages, tokenize=False)

# 推論の実行
input_ids = tokenizer(prompt, return_tensors="pt").to(model.device)
outputs = model.generate(
    **input_ids,
    max_new_tokens=128,
    do_sample=True,
    top_p=0.95,
    temperature=0.2,
    repetition_penalty=1.1,
    eos_token_id=[
        tokenizer.eos_token_id,
        tokenizer.convert_tokens_to_ids("<|eot_id|>")
    ],
)
print(tokenizer.decode(outputs[0]))

運行上述代碼後，預期會得到如下結果：

<|begin_of_text|><|start_header_id|>system<|end_header_id|>

あなたは日本語で回答するAIアシスタントです。<|eot_id|><|start_header_id|>user<|end_header_id|>

貓と犬、どっちが好き？<|eot_id|><|start_header_id|>assistant<|end_header_id|>

貓と犬の両方を飼っているので、どちらも好きだ！<|eot_id|>

📚 詳細文檔

訓練數據

llm-jp/databricks-dolly-15k-ja
cl-nagoya/auto-wiki-qa
meta-llama/Meta-Llama-3-8B-Instruct

訓練方法

對meta-llama/Meta-Llama-3-8B-Instruct模型，使用cl-nagoya/auto-wiki-qa中的約240萬條訓練數據，通過LoRA進行1個epoch的指令微調，併合並LoRA。之後，再使用llm-jp/databricks-dolly-15k-ja數據進行5個epoch的LoRA指令微調，併合並LoRA。所有訓練均採用有監督學習。