Yugo55A-4bit Open-source Serbian Large Language Model - Multi-model Fusion with Excellent Evaluation Performance

Yugo55a 4bit

Developed by datatab

Yugo55A-GPT is a Serbian-optimized large language model merged from multiple excellent models, demonstrating outstanding performance in Serbian LLM evaluations.

Large Language Model

Transformers

OtherOpen Source License:MIT #Serbian language optimization #Multi-model fusion #Instruction fine-tuning

Downloads 47

Release Time : 3/6/2024

Model Overview

This is a large language model integrating multiple pre-trained models through the mergekit linear merging method, specifically optimized for the Serbian language and supporting text generation tasks.

Model Features

Multi-model merging

Combines the strengths of excellent models including Yugo55-GPT series, AlphaMonarch-7B, and Nous-Hermes-2-Mistral

Serbian language optimization

Specifically trained and optimized for Serbian, showing outstanding performance in Serbian LLM evaluations

4bit quantization

Provides a 4bit quantized version to reduce hardware requirements while maintaining good performance

Model Capabilities

Serbian text generation

Multi-turn dialogue

Instruction following

Knowledge Q&A

Use Cases

Education

Language learning assistance

Helps Serbian language learners with language practice and knowledge queries

Content creation

Serbian content generation

Generates various text content conforming to Serbian language habits

🚀 Yugo55A-GPT `4bit`

Developed by datatab, this model is a merged pre - trained language model with excellent performance in Serbian LLM evaluation.

📚 Documentation

📄 General Information

Property	Details
Base Model	mlabonne/AlphaMonarch-7B, datatab/Yugo55-GPT-v4, datatab/Yugo55-GPT-DPO-v1-chkp-300, NousResearch/Nous-Hermes-2-Mistral-7B-DPO
Library Name	transformers
Tags	mergekit, merge, text-generation-inference, transformers, mistral
License	mit
Language	sr
Datasets	datatab/alpaca-cleaned-serbian-full, datatab/ultrafeedback_binarized, datatab/open-orca-slim-serbian

🏆 Results

The results were obtained through the Serbian LLM evaluation released by Aleksa Gordić: serbian-llm-eval.

Due to hardware resource constraints, the evaluation was conducted on a 4 - bit version of the model.

MODEL	ARC - E	ARC - C	Hellaswag	BoolQ	Winogrande	OpenbookQA	PiQA
*Yugo55 - GPT - v4 - 4bit	51.41	36.00	57.51	80.92	65.75	34.70	70.54
Yugo55A - GPT	51.52	37.78	57.52	84.40	65.43	35.60	69.43

🔗 Merge Details

Merge Method

This is a merge of pre - trained language models created using mergekit. This model was merged using the linear merge method.

Models Merged

The following models were included in the merge:

🧩 Configuration

The following YAML configuration was used to produce this model:

models:
  - model: datatab/Yugo55-GPT-v4
    parameters:
      weight: 1.0
  - model: datatab/Yugo55-GPT-DPO-v1-chkp-300
    parameters:
      weight: 1.0
  - model: mlabonne/AlphaMonarch-7B
    parameters:
      weight: 0.5
  - model: NousResearch/Nous-Hermes-2-Mistral-7B-DPO
    parameters:
      weight: 0.5
merge_method: linear
dtype: float16

💻 Usage Examples

Basic Usage

!pip -q install git+https://github.com/huggingface/transformers # need to install from github
!pip install -q datasets loralib sentencepiece
!pip -q install bitsandbytes accelerate

from IPython.display import HTML, display

def set_css():
  display(HTML('''
  <style>
    pre {
        white-space: pre-wrap;
    }
  </style>
  '''))
get_ipython().events.register('pre_run_cell', set_css)

import torch
import transformers
from transformers import AutoTokenizer, AutoModelForCausalLM

model = AutoModelForCausalLM.from_pretrained(
    "datatab/Yugo55A-GPT", torch_dtype="auto"
)

tokenizer = AutoTokenizer.from_pretrained(
    "datatab/Yugo55A-GPT", torch_dtype="auto"
)

Advanced Usage

from typing import Optional
from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer


def generate(
    user_content: str, system_content: Optional[str] = ""
) -> str:
    system_content = "Ispod je uputstvo koje opisuje zadatak, upareno sa unosom koji pruža dodatni kontekst. Napišite odgovor koji na odgovarajući način kompletira zahtev."

    messages = [
        {
            "role": "system",
            "content": system_content,
        },
        {"role": "user", "content": user_content},
    ]

    tokenized_chat = tokenizer.apply_chat_template(
        messages, tokenize=True, add_generation_prompt=True, return_tensors="pt"
    ).to("cuda")

    text_streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
    output = model.generate(
        tokenized_chat,
        streamer=text_streamer,
        max_new_tokens=2048,
        temperature=0.1,
        repetition_penalty=1.11,
        top_p=0.92,
        top_k=1000,
        pad_token_id=tokenizer.pad_token_id,
        eos_token_id=tokenizer.eos_token_id,
        do_sample=True,
    )

    generated_text = tokenizer.decode(output[0], skip_special_tokens=True)

generate("Nabroj mi sve planete suncevog sistemai reci mi koja je najveca planeta")

generate("Koja je razlika između lame, vikune i alpake?")

generate("Napišite kratku e-poruku Semu Altmanu dajući razloge za GPT-4 otvorenog koda")

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご