gemma-portuguese-luana-2b開源模型 - 優化巴西葡語，支持指令跟隨與文本生成

首頁

Gemma Portuguese Luana 2b

由rhaymison開發

這是一個基於Gemma架構的2B參數規模的葡萄牙語大語言模型，專門針對巴西葡萄牙語優化，支持指令跟隨和文本生成任務。

大型語言模型

Transformers

其他開源協議:Apache-2.0 #葡萄牙語指令模型 #巴西葡萄牙文優化 #多任務文本生成

下載量 115

發布時間 : 3/25/2024

模型概述

該模型是一個針對葡萄牙語（特別是巴西葡萄牙語）優化的指令跟隨大語言模型，基於Gemma架構開發，適用於多種文本生成和理解任務。

模型特點

葡萄牙語優化

專門針對巴西葡萄牙語進行訓練和優化，提供更自然的語言處理能力

指令跟隨

能夠理解和執行復雜的自然語言指令

多任務處理

支持多種文本生成和理解任務

模型能力

文本生成

指令理解

問答系統

內容創作

文本摘要

使用案例

教育

ENEM考試輔助

幫助學生準備巴西國家中等教育考試(ENEM)

在ENEM挑戰賽數據集上達到24.42%準確率

法律

OAB律師考試輔助

協助準備巴西律師資格考試

在OAB考試數據集上達到27.11%準確率

內容審核

仇恨言論檢測

識別葡萄牙語中的仇恨言論

在HateBR數據集上達到40.05%宏觀F1分數

🚀 gemma-portuguese-2b-luana

gemma-portuguese-2b-luana 是一個專注於葡萄牙語的文本生成模型，使用超集數據集進行訓練。它能理解葡萄牙語推理，雖未針對數學和代碼任務訓練，但可通過微調適配特定領域。

🚀 快速開始

模型描述

更新時間：2024-04-10 20:06

gemma-portuguese-2b 模型是一個葡萄牙語模型，使用包含 250,000 條指令的超集數據集進行訓練。該模型主要專注於文本生成和指令處理，未針對數學和代碼任務進行訓練。它是一個通用模型，重點在於理解葡萄牙語推理。通過針對葡萄牙語的微調，你可以將該模型調整用於特定領域。

如何使用

以下是使用該模型進行文本生成的示例代碼：

from transformers import AutoTokenizer, pipeline
import torch

model = "rhaymison/gemma-portuguese-luana-2b"

tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = pipeline(
    "text-generation",
    model=model,
    model_kwargs={"torch_dtype": torch.bfloat16},
    device="cuda",
)

messages = [
   {
      "role": "system",
      "content": "Abaixo está uma instrução que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto. Escreva uma resposta que complete adequadamente o pedido."
    },
    {"role": "user", "content": "Me conte sobre a ida do homem a Lua."},
]
prompt = pipeline.tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
outputs = pipeline(
    prompt,
    max_new_tokens=256,
    do_sample=True,
    temperature=0.2,
    top_k=50,
    top_p=0.95
)
print(outputs[0]["generated_text"][len(prompt):].replace("model",""))

#A viagem à Lua foi um esforço monumental realizado pela Agência Espacial dos EUA entre 1969 e 1972.
#Foi um marco significativo na exploração espacial e na ciência humana.
#Aqui está uma visão geral de sua jornada: 1. O primeiro voo espacial humano foi o de Yuri Gagarin, que voou a Terra em 12 de abril de 1961.

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer2 = AutoTokenizer.from_pretrained("rhaymison/gemma-portuguese-luana-2b")
model2 = AutoModelForCausalLM.from_pretrained("rhaymison/gemma-portuguese-luana-2b", device_map={"":0})
tokenizer2.pad_token = tokenizer2.eos_token
tokenizer2.add_eos_token = True
tokenizer2.add_bos_token, tokenizer2.add_eos_token
tokenizer2.padding_side = "right"

text = f"""<start_of_turn>user 
Abaixo está uma instrução que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto. Escreva uma resposta que complete adequadamente o pedido.
###instrução:Me conte sobre a ida do homem a Lua.<end_of_turn> 
<start_of_turn>model """

device = "cuda:0"

inputs = tokenizer2(text, return_tensors="pt").to(device)

outputs = model2.generate(**inputs, max_new_tokens=256, do_sample=False)

output = tokenizer2.decode(outputs[0], skip_special_tokens=True, skip_prompt=True)
print(output.replace("model"," "))

#A viagem à Lua foi um esforço monumental realizado pela Agência Espacial dos EUA entre 1969 e 1972.
#Foi um marco significativo na exploração espacial e na ciência humana.
#Aqui está uma visão geral de sua jornada: 1. O primeiro voo espacial humano foi o de Yuri Gagarin, que voou a Terra em 12 de abril de 1961.

text = f"""<start_of_turn>user 
Abaixo está uma instrução que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto. Escreva uma resposta que complete adequadamente o pedido.
###instrução:Me explique como funciona um computador.<end_of_turn> 
<start_of_turn>model """

device = "cuda:0"

inputs = tokenizer2(text, return_tensors="pt").to(device)

outputs = model2.generate(**inputs, max_new_tokens=256, do_sample=False)

output = tokenizer2.decode(outputs[0], skip_special_tokens=True, skip_prompt=True)
print(output.replace("model"," "))

#Um computador é um dispositivo eletrônico que pode executar tarefas que um humano pode fazer.
#Ele usa um conjunto de circuitos elétricos, componentes eletrônicos e software para processar informações e executar tarefas.
#Os componentes de um computador incluem um processador, memória, unidade de armazenamento, unidade de processamento gráfica,
#unidade de controle, unidade de entrada e saída,e dispositivos de entrada e saída.
#O processador é o coração do computador e executa instruções de software.A memória é onde o computador armazena

📚 詳細文檔

開放葡萄牙語大語言模型排行榜評估結果

詳細結果可在此處和 🚀 開放葡萄牙語大語言模型排行榜查看。

指標	值
平均值	34.94
巴西國家高考挑戰（無圖像）	24.42
BLUEX（無圖像）	24.34
巴西律師協會考試	27.11
Assin2 RTE	70.86
Assin2 STS	1.51
FaQuAD NLI	43.97
HateBR 二分類	40.05
葡萄牙語仇恨言論二分類	51.83
tweetSentBR	30.42