phi-3-portuguese-tom-cat-4k-instruct开源模型 - 助力葡萄牙语交流应用场景

首页

Phi 3 Portuguese Tom Cat 4k Instruct

由 rhaymison 开发

基于30万条葡萄牙语指令数据集训练的葡萄牙语模型，由microsoft/Phi-3-mini-4k微调而来

大型语言模型

Transformers

其他开源协议:Apache-2.0 #葡萄牙语指令微调 #教育考试问答 #小参数高效模型

下载量 83

发布时间 : 4/29/2024

模型简介

该模型旨在填补葡萄牙语模型的空白，支持问答和指令任务，适用于多种葡萄牙语文本生成场景

模型特点

葡萄牙语优化

专门针对葡萄牙语进行优化训练，填补了葡萄牙语模型的空白

指令微调

基于30万条葡萄牙语指令数据集进行微调，擅长理解和执行各种指令

多量化支持

提供多种量化版本（4位、8位、16位等），适应不同硬件需求

模型能力

葡萄牙语文本生成

问答系统

指令执行

文本分类

语义相似度计算

使用案例

教育

ENEM考试辅助

帮助学生解答ENEM考试相关问题

在ENEM挑战赛数据集上达到61.58%准确率

法律

OAB考试辅助

解答巴西律师资格考试相关问题

在OAB考试数据集上达到43.69%准确率

社交媒体分析

仇恨言论检测

识别葡萄牙语中的仇恨言论

在HateBR数据集上达到83.01%宏F1值

🚀 Phi-3-portuguese-tom-cat-4k-instruct

本模型基于300,000条葡萄牙语指令的超集进行训练，旨在填补葡萄牙语模型的空白。它是从microsoft/Phi-3-mini-4k微调而来。

🚀 快速开始

模型使用环境建议

完整模型：建议使用A100。
半精度模型：可使用L4。
8位或4位量化：T4或V100即可。

安装依赖

!pip install -q -U transformers
!pip install -q -U accelerate
!pip install -q -U bitsandbytes

加载模型和分词器

from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
model = AutoModelForCausalLM.from_pretrained("rhaymison/phi-3-portuguese-tom-cat-4k-instruct", device_map= {"": 0})
tokenizer = AutoTokenizer.from_pretrained("rhaymison/phi-3-portuguese-tom-cat-4k-instruct")
model.eval()

使用Pipeline进行文本生成

from transformers import pipeline
pipe = pipeline("text-generation",
                model=model,
                tokenizer=tokenizer,
                do_sample=True,
                max_new_tokens=512,
                num_beams=2,
                temperature=0.3,
                top_k=50,
                top_p=0.95,
                early_stopping=True,
                pad_token_id=tokenizer.eos_token_id,
                )


def format_template(question:str):
    system_prompt = "Abaixo está uma instrução que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto. Escreva uma resposta que complete adequadamente o pedido."
    return f"""<s><|system|>
    { system_prompt }
    <|user|>
    { question }
    <|assistant|>
    """

question = format_template("E possivel ir de Carro dos Estados unidos ate o japão")
pipe(question)

4位量化示例

如果你遇到“CUDA Out of memory”等内存问题，可使用4位或8位量化。

from transformers import BitsAndBytesConfig
import torch
nb_4bit_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16,
    bnb_4bit_use_double_quant=True
)

model = AutoModelForCausalLM.from_pretrained(
    base_model,
    quantization_config=bnb_config,
    device_map={"": 0}
)

✨ 主要特性

基于300,000条葡萄牙语指令的超集进行训练，有助于填补葡萄牙语模型的空白。
可进行正常形式的使用，也支持到4位量化。
有对应的GGUF家族模型，可使用LlamaCpp运行，增强了兼容性。

📦 安装指南

使用该模型前，需要安装以下依赖：

!pip install -q -U transformers
!pip install -q -U accelerate
!pip install -q -U bitsandbytes

💻 使用示例

基础用法

# 安装依赖
!pip install -q -U transformers
!pip install -q -U accelerate
!pip install -q -U bitsandbytes

# 加载模型和分词器
from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
model = AutoModelForCausalLM.from_pretrained("rhaymison/phi-3-portuguese-tom-cat-4k-instruct", device_map= {"": 0})
tokenizer = AutoTokenizer.from_pretrained("rhaymison/phi-3-portuguese-tom-cat-4k-instruct")
model.eval()

# 使用Pipeline进行文本生成
from transformers import pipeline
pipe = pipeline("text-generation",
                model=model,
                tokenizer=tokenizer,
                do_sample=True,
                max_new_tokens=512,
                num_beams=2,
                temperature=0.3,
                top_k=50,
                top_p=0.95,
                early_stopping=True,
                pad_token_id=tokenizer.eos_token_id,
                )

def format_template(question:str):
    system_prompt = "Abaixo está uma instrução que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto. Escreva uma resposta que complete adequadamente o pedido."
    return f"""<s><|system|>
    { system_prompt }
    <|user|>
    { question }
    <|assistant|>
    """

question = format_template("E possivel ir de Carro dos Estados unidos ate o japão")
pipe(question)

高级用法

如果你遇到“CUDA Out of memory”等内存问题，可使用4位或8位量化：

from transformers import BitsAndBytesConfig
import torch
nb_4bit_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16,
    bnb_4bit_use_double_quant=True
)

model = AutoModelForCausalLM.from_pretrained(
    base_model,
    quantization_config=bnb_config,
    device_map={"": 0}
)

📚 详细文档

模型相关信息

属性	详情
模型类型	phi-3-portuguese-tom-cat-4k-instruct
基础模型	microsoft/Phi-3-mini-4k-instruct
训练数据	rhaymison/superset
许可证	apache-2.0

其他GGUF模型

如果你需要增强兼容性，Luana模型也有可以使用LlamaCpp运行的GGUF家族模型：

评估结果

详细的评估结果可以在这里和🚀 Open Portuguese LLM Leaderboard找到。

指标	值
平均值	64.57
ENEM Challenge (No Images)	61.58
BLUEX (No Images)	50.63
OAB Exams	43.69
Assin2 RTE	91.54
Assin2 STS	75.27
FaQuAD NLI	47.46
HateBR Binary	83.01
PT Hate Speech Binary	70.19
tweetSentBR	57.78