Boana-7B-Instruct开源模型 - 专为葡萄牙语用户提供低复杂度语言支持

首页

Boana 7b Instruct

由 lrds-code 开发

Boana-7B-Instruct是一个基于LLaMA2-7B的葡萄牙语指令微调模型，专为葡萄牙语用户设计，提供较低复杂度的LLM选项。

大型语言模型

Transformers

其他#葡萄牙语生成 #低资源优化 #LLaMA2微调

下载量 24

发布时间 : 1/20/2024

模型简介

该模型基于LLaMA2-7B架构，针对葡萄牙语进行了微调，旨在为计算资源有限的用户提供高效的文本生成能力。

模型特点

葡萄牙语优化

专门针对葡萄牙语进行微调，提供更自然的语言生成能力。

低资源需求

基于70亿参数的LLaMA2-7B，适合计算资源有限的用户。

指令跟随

支持指令跟随，能够根据用户指令生成相关文本。

模型能力

文本生成

指令跟随

葡萄牙语理解与生成

使用案例

教育

语言学习辅助

帮助学生练习葡萄牙语写作和阅读理解。

内容创作

葡萄牙语内容生成

生成葡萄牙语的博客文章、故事或其他创意内容。

🚀 Boana-7B-Instruct

Boana-7B-Instruct 是一个基于葡萄牙语数据训练的大语言模型（LLM）。该模型基于 LLaMA2-7B 构建，这是 LLaMA-2 的一个 70 亿参数版本。Boana 项目旨在提供葡萄牙语的大语言模型选项，同时提供一个复杂度较低的模型，以便计算能力较弱的用户也能使用大语言模型。

该项目支持所有葡萄牙语国家。

Boana Logo

✨ 主要特性

语言针对性：专门针对葡萄牙语数据进行训练，能更好地处理葡萄牙语相关任务。
低复杂度：基于 LLaMA2-7B 微调，适合计算能力有限的用户。

📦 安装指南

文档中未提及安装步骤，若有安装需求，请参考相关依赖库（如 transformers）的官方文档进行安装。

💻 使用示例

基础用法

import torch
from transformers import pipeline

boana = pipeline('text-generation', model='lrds-code/boana-7b-instruct', torch_dtype=torch.bfloat16, device_map='auto')

messages = [{'role':'system',
             'content':''},
            {'role':'user',
             'content':'Quantos planetas existem no sistema solar?'}]

prompt = boana.tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
outputs = boana(prompt, max_new_tokens=256, do_sample=False, temperature=0, top_k=50, top_p=0.95)
print(outputs[0]['generated_text'])

# <s>[INST] <<SYS>>

# <</SYS>>

# Quantos planetas existem no sistema solar? [/INST]  O sistema solar consiste em 8 planetas:

# 1. Mercurio
# 2. Vênus
# 3. Terra
# 4. Marte
# 5. Júpiter
# 6. Saturno
# 8. Netuno

# Além desses planetas, o sistema solar também inclui outros corpos celestes, como asteroides, cometas e anões, bem como várias luas e satélites naturais

高级用法

在实际使用中，可根据需求调整生成参数，以获得不同风格和质量的文本。例如：

# 调整 repetition_penalty 避免重复，do_sample 引入随机性，temperature 控制随机性程度
outputs = boana(prompt, max_new_tokens=256, repetition_penalty=1.2, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
print(outputs[0]['generated_text'])

📚 详细文档

模型描述

属性	详情
开发者	Leonardo Souza
模型类型	基于 LLaMA
许可证	Academic Free License v3.0
微调模型	LLaMA2-7B

重要参数说明

repetition_penalty：用于避免单词或短语的重复。当该值设置大于 1 时，模型会尝试降低生成已出现过单词的概率。值越大，模型越倾向于避免重复。
do_sample：决定模型是否根据计算出的概率随机采样下一个单词。do_sample=True 会为生成的文本引入变化和不可预测性，而 do_sample=False 时，模型总是选择最可能的单词作为下一个单词，可能导致输出更具确定性，但也可能更重复。
temperature：影响选择下一个单词的随机性。较低的值（接近 0）使模型在选择时更“自信”，倾向于高概率的单词，输出更可预测；较高的值会增加随机性，允许模型选择概率较低的单词，使生成的文本更多样化和有创意。