gemma-portuguese-luana-2b开源模型 - 优化巴西葡语，支持指令跟随与文本生成

首页

Gemma Portuguese Luana 2b

由 rhaymison 开发

这是一个基于Gemma架构的2B参数规模的葡萄牙语大语言模型，专门针对巴西葡萄牙语优化，支持指令跟随和文本生成任务。

大型语言模型

Transformers

其他开源协议:Apache-2.0 #葡萄牙语指令模型 #巴西葡萄牙文优化 #多任务文本生成

下载量 115

发布时间 : 3/25/2024

模型简介

该模型是一个针对葡萄牙语（特别是巴西葡萄牙语）优化的指令跟随大语言模型，基于Gemma架构开发，适用于多种文本生成和理解任务。

模型特点

葡萄牙语优化

专门针对巴西葡萄牙语进行训练和优化，提供更自然的语言处理能力

指令跟随

能够理解和执行复杂的自然语言指令

多任务处理

支持多种文本生成和理解任务

模型能力

文本生成

指令理解

问答系统

内容创作

文本摘要

使用案例

教育

ENEM考试辅助

帮助学生准备巴西国家中等教育考试(ENEM)

在ENEM挑战赛数据集上达到24.42%准确率

法律

OAB律师考试辅助

协助准备巴西律师资格考试

在OAB考试数据集上达到27.11%准确率

内容审核

仇恨言论检测

识别葡萄牙语中的仇恨言论

在HateBR数据集上达到40.05%宏观F1分数

🚀 gemma-portuguese-2b-luana

gemma-portuguese-2b-luana 是一个专注于葡萄牙语的文本生成模型，使用超集数据集进行训练。它能理解葡萄牙语推理，虽未针对数学和代码任务训练，但可通过微调适配特定领域。

🚀 快速开始

模型描述

更新时间：2024-04-10 20:06

gemma-portuguese-2b 模型是一个葡萄牙语模型，使用包含 250,000 条指令的超集数据集进行训练。该模型主要专注于文本生成和指令处理，未针对数学和代码任务进行训练。它是一个通用模型，重点在于理解葡萄牙语推理。通过针对葡萄牙语的微调，你可以将该模型调整用于特定领域。

如何使用

以下是使用该模型进行文本生成的示例代码：

from transformers import AutoTokenizer, pipeline
import torch

model = "rhaymison/gemma-portuguese-luana-2b"

tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = pipeline(
    "text-generation",
    model=model,
    model_kwargs={"torch_dtype": torch.bfloat16},
    device="cuda",
)

messages = [
   {
      "role": "system",
      "content": "Abaixo está uma instrução que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto. Escreva uma resposta que complete adequadamente o pedido."
    },
    {"role": "user", "content": "Me conte sobre a ida do homem a Lua."},
]
prompt = pipeline.tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
outputs = pipeline(
    prompt,
    max_new_tokens=256,
    do_sample=True,
    temperature=0.2,
    top_k=50,
    top_p=0.95
)
print(outputs[0]["generated_text"][len(prompt):].replace("model",""))

#A viagem à Lua foi um esforço monumental realizado pela Agência Espacial dos EUA entre 1969 e 1972.
#Foi um marco significativo na exploração espacial e na ciência humana.
#Aqui está uma visão geral de sua jornada: 1. O primeiro voo espacial humano foi o de Yuri Gagarin, que voou a Terra em 12 de abril de 1961.

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer2 = AutoTokenizer.from_pretrained("rhaymison/gemma-portuguese-luana-2b")
model2 = AutoModelForCausalLM.from_pretrained("rhaymison/gemma-portuguese-luana-2b", device_map={"":0})
tokenizer2.pad_token = tokenizer2.eos_token
tokenizer2.add_eos_token = True
tokenizer2.add_bos_token, tokenizer2.add_eos_token
tokenizer2.padding_side = "right"

text = f"""<start_of_turn>user 
Abaixo está uma instrução que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto. Escreva uma resposta que complete adequadamente o pedido.
###instrução:Me conte sobre a ida do homem a Lua.<end_of_turn> 
<start_of_turn>model """

device = "cuda:0"

inputs = tokenizer2(text, return_tensors="pt").to(device)

outputs = model2.generate(**inputs, max_new_tokens=256, do_sample=False)

output = tokenizer2.decode(outputs[0], skip_special_tokens=True, skip_prompt=True)
print(output.replace("model"," "))

#A viagem à Lua foi um esforço monumental realizado pela Agência Espacial dos EUA entre 1969 e 1972.
#Foi um marco significativo na exploração espacial e na ciência humana.
#Aqui está uma visão geral de sua jornada: 1. O primeiro voo espacial humano foi o de Yuri Gagarin, que voou a Terra em 12 de abril de 1961.

text = f"""<start_of_turn>user 
Abaixo está uma instrução que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto. Escreva uma resposta que complete adequadamente o pedido.
###instrução:Me explique como funciona um computador.<end_of_turn> 
<start_of_turn>model """

device = "cuda:0"

inputs = tokenizer2(text, return_tensors="pt").to(device)

outputs = model2.generate(**inputs, max_new_tokens=256, do_sample=False)

output = tokenizer2.decode(outputs[0], skip_special_tokens=True, skip_prompt=True)
print(output.replace("model"," "))

#Um computador é um dispositivo eletrônico que pode executar tarefas que um humano pode fazer.
#Ele usa um conjunto de circuitos elétricos, componentes eletrônicos e software para processar informações e executar tarefas.
#Os componentes de um computador incluem um processador, memória, unidade de armazenamento, unidade de processamento gráfica,
#unidade de controle, unidade de entrada e saída,e dispositivos de entrada e saída.
#O processador é o coração do computador e executa instruções de software.A memória é onde o computador armazena

📚 详细文档

开放葡萄牙语大语言模型排行榜评估结果

详细结果可在此处和 🚀 开放葡萄牙语大语言模型排行榜查看。

指标	值
平均值	34.94
巴西国家高考挑战（无图像）	24.42
BLUEX（无图像）	24.34
巴西律师协会考试	27.11
Assin2 RTE	70.86
Assin2 STS	1.51
FaQuAD NLI	43.97
HateBR 二分类	40.05
葡萄牙语仇恨言论二分类	51.83
tweetSentBR	30.42