Yugo55A - 4bitオープンソースのセルビア語大型言語モデル - 多モデル融合、評価で優れた成績を収める

ホーム

Yugo55a 4bit

datatabによって開発

Yugo55A-GPTは複数の優れたモデルを統合したセルビア語最適化大規模言語モデルで、セルビアLLM評価で優れた性能を発揮しています。

大規模言語モデル

Transformers

その他オープンソースライセンス:MIT #セルビア語最適化 #マルチモデル融合 #命令微調整

ダウンロード数 47

リリース時間 : 3/6/2024

モデル概要

これはmergekitの線形統合手法を用いて複数の事前学習モデルを統合した大規模言語モデルで、特にセルビア語に最適化されており、テキスト生成タスクをサポートします。

モデル特徴

マルチモデル統合

Yugo55-GPTシリーズ、AlphaMonarch-7B、Nous-Hermes-2-Mistralなどの優れたモデルの長所を統合

セルビア語最適化

特にセルビア語向けに訓練・最適化されており、セルビアLLM評価で優れた性能を発揮

4bit量子化

4bit量子化版を提供し、ハードウェア要件を低減しながら良好な性能を維持

モデル能力

セルビア語テキスト生成

マルチターン対話

命令追従

知識質問応答

使用事例

教育

言語学習支援

セルビア語学習者の言語練習や知識検索を支援

コンテンツ作成

セルビア語コンテンツ生成

セルビア語の言語習慣に合致した様々なテキストコンテンツを生成

🚀 Yugo55A-GPT `4bit`

Yugo55A-GPTはdatatabによって開発されたモデルで、MITライセンスの下で提供されています。このモデルは、セルビア語のデータセットを用いて訓練され、セルビア語の自然言語処理タスクに適しています。

🚀 クイックスタート

Yugo55A-GPTを使用するには、まず必要なライブラリをインストールする必要があります。以下のコマンドを実行して、必要なライブラリをインストールしましょう。

!pip -q install git+https://github.com/huggingface/transformers # need to install from github
!pip install -q datasets loralib sentencepiece
!pip -q install bitsandbytes accelerate

✨ 主な機能

🏆 評価結果

このモデルは、Aleksa Gordićによって公開されたセルビア語のLLM評価ツール serbian-llm-eval を用いて評価されています。評価はハードウェアリソースの制約により、4-bitバージョンのモデルで行われました。

MODEL	ARC-E	ARC-C	Hellaswag	BoolQ	Winogrande	OpenbookQA	PiQA
*Yugo55-GPT-v4-4bit	51.41	36.00	57.51	80.92	65.75	34.70	70.54
Yugo55A-GPT	51.52	37.78	57.52	84.40	65.43	35.60	69.43

🔗 マージの詳細

マージ方法

このモデルは、mergekit を用いて事前学習された言語モデルをマージして作成されています。マージ方法には、linear マージ方法が使用されています。

マージされたモデル

以下のモデルがマージに含まれています。

🧩 設定

このモデルを生成するために使用されたYAML設定は以下の通りです。

models:
  - model: datatab/Yugo55-GPT-v4
    parameters:
      weight: 1.0
  - model: datatab/Yugo55-GPT-DPO-v1-chkp-300
    parameters:
      weight: 1.0
  - model: mlabonne/AlphaMonarch-7B
    parameters:
      weight: 0.5
  - model: NousResearch/Nous-Hermes-2-Mistral-7B-DPO
    parameters:
      weight: 0.5
merge_method: linear
dtype: float16

💻 使用例

基本的な使用法

from IPython.display import HTML, display

def set_css():
  display(HTML('''
  <style>
    pre {
        white-space: pre-wrap;
    }
  </style>
  '''))
get_ipython().events.register('pre_run_cell', set_css)

import torch
import transformers
from transformers import AutoTokenizer, AutoModelForCausalLM

model = AutoModelForCausalLM.from_pretrained(
    "datatab/Yugo55A-GPT", torch_dtype="auto"
)

tokenizer = AutoTokenizer.from_pretrained(
    "datatab/Yugo55A-GPT", torch_dtype="auto"
)

高度な使用法

from typing import Optional
from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer

def generate(
    user_content: str, system_content: Optional[str] = ""
) -> str:
    system_content = "Ispod je uputstvo koje opisuje zadatak, upareno sa unosom koji pruža dodatni kontekst. Napišite odgovor koji na odgovarajući način kompletira zahtev."

    messages = [
        {
            "role": "system",
            "content": system_content,
        },
        {"role": "user", "content": user_content},
    ]

    tokenized_chat = tokenizer.apply_chat_template(
        messages, tokenize=True, add_generation_prompt=True, return_tensors="pt"
    ).to("cuda")

    text_streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
    output = model.generate(
        tokenized_chat,
        streamer=text_streamer,
        max_new_tokens=2048,
        temperature=0.1,
        repetition_penalty=1.11,
        top_p=0.92,
        top_k=1000,
        pad_token_id=tokenizer.pad_token_id,
        eos_token_id=tokenizer.eos_token_id,
        do_sample=True,
    )

    generated_text = tokenizer.decode(output[0], skip_special_tokens=True)

# 生成例
generate("Nabroj mi sve planete suncevog sistemai reci mi koja je najveca planeta")
generate("Koja je razlika između lame, vikune i alpake?")
generate("Napišite kratku e-poruku Semu Altmanu dajući razloge za GPT-4 otvorenog koda")