Gemma-Portuguese-Luana-2b Open Source Model - Optimized for Brazilian Portuguese, Supports Instruction Following and Text Generation

Gemma Portuguese Luana 2b

Developed by rhaymison

This is a 2B-parameter Portuguese large language model based on the Gemma architecture, specifically optimized for Brazilian Portuguese, supporting instruction-following and text generation tasks.

Large Language Model

Transformers

OtherOpen Source License:Apache-2.0 #Portuguese Instruction Model #Brazilian Portuguese Optimization #Multitask Text Generation

Downloads 115

Release Time : 3/25/2024

Model Overview

This model is an instruction-following large language model optimized for Portuguese (particularly Brazilian Portuguese), developed based on the Gemma architecture, suitable for various text generation and comprehension tasks.

Model Features

Portuguese Optimization

Specially trained and optimized for Brazilian Portuguese, providing more natural language processing capabilities.

Instruction Following

Capable of understanding and executing complex natural language instructions.

Multitask Processing

Supports various text generation and comprehension tasks.

Model Capabilities

Text Generation

Instruction Understanding

Question Answering

Content Creation

Text Summarization

Use Cases

Education

ENEM Exam Assistance

Helps students prepare for the Brazilian National High School Exam (ENEM).

Achieved 24.42% accuracy on the ENEM challenge dataset.

Legal

OAB Bar Exam Assistance

Assists in preparing for the Brazilian Bar Examination.

Achieved 27.11% accuracy on the OAB exam dataset.

Content Moderation

Hate Speech Detection

Identifies hate speech in Portuguese.

Achieved 40.05% macro F1 score on the HateBR dataset.

🚀 gemma-portuguese-2b-luana

The gemma-portuguese-2b-luana is a Portuguese model specialized in text generation and instruction understanding. Trained on a superset dataset with 250,000 instructions, it focuses on understanding Portuguese inferences and can be fine - tuned for specific fields.

🚀 Quick Start

Prerequisites

Ensure you have transformers and torch installed in your Python environment.

Installation

pip install transformers torch

Usage Examples

Basic Usage

from transformers import AutoTokenizer, pipeline
import torch

model = "rhaymison/gemma-portuguese-luana-2b"

tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = pipeline(
    "text-generation",
    model=model,
    model_kwargs={"torch_dtype": torch.bfloat16},
    device="cuda",
)

messages = [
   {
      "role": "system",
      "content": "Abaixo está uma instrução que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto. Escreva uma resposta que complete adequadamente o pedido."
    },
    {"role": "user", "content": "Me conte sobre a ida do homem a Lua."},
]
prompt = pipeline.tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
outputs = pipeline(
    prompt,
    max_new_tokens=256,
    do_sample=True,
    temperature=0.2,
    top_k=50,
    top_p=0.95
)
print(outputs[0]["generated_text"][len(prompt):].replace("model",""))

#A viagem à Lua foi um esforço monumental realizado pela Agência Espacial dos EUA entre 1969 e 1972.
#Foi um marco significativo na exploração espacial e na ciência humana.
#Aqui está uma visão geral de sua jornada: 1. O primeiro voo espacial humano foi o de Yuri Gagarin, que voou a Terra em 12 de abril de 1961.

Advanced Usage

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer2 = AutoTokenizer.from_pretrained("rhaymison/gemma-portuguese-luana-2b")
model2 = AutoModelForCausalLM.from_pretrained("rhaymison/gemma-portuguese-luana-2b", device_map={"":0})
tokenizer2.pad_token = tokenizer2.eos_token
tokenizer2.add_eos_token = True
tokenizer2.add_bos_token, tokenizer2.add_eos_token
tokenizer2.padding_side = "right"

text = f"""<start_of_turn>user 
Abaixo está uma instrução que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto. Escreva uma resposta que complete adequadamente o pedido.
###instrução:Me explique como funciona um computador.<end_of_turn> 
<start_of_turn>model """

device = "cuda:0"

inputs = tokenizer2(text, return_tensors="pt").to(device)

outputs = model2.generate(**inputs, max_new_tokens=256, do_sample=False)

output = tokenizer2.decode(outputs[0], skip_special_tokens=True, skip_prompt=True)
print(output.replace("model"," "))

#Um computador é um dispositivo eletrônico que pode executar tarefas que um humano pode fazer.
#Ele usa um conjunto de circuitos elétricos, componentes eletrônicos e software para processar informações e executar tarefas.
#Os componentes de um computador incluem um processador, memória, unidade de armazenamento, unidade de processamento gráfica,
#unidade de controle, unidade de entrada e saída,e dispositivos de entrada e saída.
#O processador é o coração do computador e executa instruções de software.A memória é onde o computador armazena

📚 Documentation

Model description

Updated: 2024 - 04 - 10 20:06

The gemma - portuguese - 2b model is a Portuguese model trained with the superset dataset with 250,000 instructions. The model is mainly focused on text generation and instruction. The model was not trained on math and code tasks. The model is generalist with a focus on understanding Portuguese inferences. With this fine - tuning for Portuguese, you can adjust the model for a specific field.

Open Portuguese LLM Leaderboard Evaluation Results

Detailed results can be found here and on the 🚀 Open Portuguese LLM Leaderboard

Metric	Value
Average	34.94
ENEM Challenge (No Images)	24.42
BLUEX (No Images)	24.34
OAB Exams	27.11
Assin2 RTE	70.86
Assin2 STS	1.51
FaQuAD NLI	43.97
HateBR Binary	40.05
PT Hate Speech Binary	51.83
tweetSentBR	30.42

Comments

Any idea, help or report will always be welcome.

Email: rhaymisoncristian@gmail.com

📄 License

This project is licensed under the Apache - 2.0 license.

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご