llama3-8b-tr-finetunedオープンソースモデル - 無料でデプロイしてトルコ語テキストを簡単に生成する

ホーム

Llama3 8b Tr Finetuned

cenfisによって開発

Unsloth量子化Llama 3-8Bモデルをファインチューニングしたトルコ語アダプターモデルで、トルコ語テキスト生成タスクに適しています

大規模言語モデル英語オープンソースライセンス:Apache-2.0 #トルコ語ファインチューニング #高速トレーニング #Alpaca命令テンプレート

ダウンロード数 54

リリース時間 : 5/16/2024

モデル概要

これは教育・実験目的のトルコ語ファインチューニングモデルで、Llama 3-8Bアーキテクチャを基に、トルコ語テキスト生成タスク向けに最適化されています。

モデル特徴

効率的なファインチューニング

PEFT技術を使用した効率的なファインチューニングで、わずか8分のトレーニング時間で済みます

トルコ語最適化

トルコ語データセットに特化してファインチューニングされ、トルコ語生成能力を最適化しています

マルチフォーマット対応

.ggufと.bin形式の変換を提供し、llama.cppとvLLM推論をサポートします

モデル能力

トルコ語テキスト生成

命令追従

質問応答システム

使用事例

教育

トルコ語学習アシスタント

学生向けにトルコ語学習教材や練習問題を生成します

旅行

トルコ旅行情報生成

トルコの観光スポット紹介やおすすめ情報を生成します

出力例にはアンカラの3つの観光地の簡単な説明が含まれています

🚀 Llama 3-8B トルコ語モデル

このリポジトリには、トルコ語版Llama 3プロジェクトの実験・教育目的で微調整されたモデルと、様々な用途に使用できるバリアントが含まれています。

実際に学習されたモデルは、UnslothのLlama 3-8B量子化モデルのアダプターモデルで、その後llama.cppを使用して.gguf形式に、vLLM用に.bin形式に変換されます。

このモデルはさらなる開発が可能で、質の高いデータを入手したら、引き続きモデルの学習を行います。一部のトルコ語データセットは英語からの翻訳品質が低いため、すべてのデータセットを使用することはできません。

微調整コードにはこちらからアクセスできます。

NVIDIA L4を使用して150ステップで学習を行い、約8分かかりました。

🚀 クイックスタート

このモデルは、トルコ語版Llama 3プロジェクトのために微調整されたアダプターモデルです。以下のセクションでは、このモデルの使用方法を説明します。

✨ 主な機能

トルコ語に特化した微調整モデルで、トルコ語の自然言語処理タスクに適しています。
アダプターモデル形式で提供され、PEFTライブラリを使用して簡単に統合できます。
.gguf形式と.bin形式に変換可能で、llama.cppとvLLMで使用できます。

💻 使用例

基本的な使用法

PEFTを使用してアダプターモデルを利用することができます。

from peft import PeftModel, PeftConfig
from transformers import AutoModelForCausalLM, AutoTokenizer

base_model = AutoModelForCausalLM.from_pretrained("unsloth/llama-3-8b-bnb-4bit")
model = PeftModel.from_pretrained(base_model, "myzens/llama3-8b-tr-finetuned")
tokenizer = AutoTokenizer.from_pretrained("myzens/llama3-8b-tr-finetuned")

alpaca_prompt = """
Instruction:
{}

Input:
{}

Response:
{}"""

inputs = tokenizer([
    alpaca_prompt.format(
        "",
        "Ankara'da gezilebilecek 3 yeri söyle ve ne olduklarını kısaca açıkla.",
        "",
)], return_tensors = "pt").to("cuda")


outputs = model.generate(**inputs, max_new_tokens=256)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

高度な使用法

Transformersライブラリを直接使用することもできます。

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("myzens/llama3-8b-tr-finetuned")
model = AutoModelForCausalLM.from_pretrained("myzens/llama3-8b-tr-finetuned")

alpaca_prompt = """
Instruction:
{}

Input:
{}

Response:
{}"""

inputs = tokenizer([
    alpaca_prompt.format(
        "",
        "Ankara'da gezilebilecek 3 yeri söyle ve ne olduklarını kısaca açıkla.",
        "",
)], return_tensors = "pt").to("cuda")


outputs = model.generate(**inputs, max_new_tokens=192)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

パイプラインを使用した使用法

Transformersのパイプラインを使用して、簡単にテキスト生成を行うことができます。

from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline

tokenizer = AutoTokenizer.from_pretrained("myzens/llama3-8b-tr-finetuned")
model = AutoModelForCausalLM.from_pretrained("myzens/llama3-8b-tr-finetuned")

pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)

alpaca_prompt = """
Instruction:
{}

Input:
{}

Response:
{}"""

input = alpaca_prompt.format(
        "",
        "Ankara'da gezilebilecek 3 yeri söyle ve ne olduklarını kısaca açıkla.",
        "",
)

pipe(input)

出力例

Instruction:


Input:
Ankara'da gezilebilecek 3 yeri söyle ve ne olduklarını kısaca açıkla.

Response:
1. Anıtkabir - Mustafa Kemal Atatürk'ün mezarı
2. Gençlik ve Spor Sarayı - spor etkinliklerinin yapıldığı yer
3. Kızılay Meydanı - Ankara'nın merkezinde bulunan bir meydan