phi-3-portuguese-tom-cat-4k-instruct開源模型 - 助力葡萄牙語交流應用場景

首頁

Phi 3 Portuguese Tom Cat 4k Instruct

由rhaymison開發

基於30萬條葡萄牙語指令數據集訓練的葡萄牙語模型，由microsoft/Phi-3-mini-4k微調而來

大型語言模型

Transformers

其他開源協議:Apache-2.0 #葡萄牙語指令微調 #教育考試問答 #小參數高效模型

下載量 83

發布時間 : 4/29/2024

模型概述

該模型旨在填補葡萄牙語模型的空白，支持問答和指令任務，適用於多種葡萄牙語文本生成場景

模型特點

葡萄牙語優化

專門針對葡萄牙語進行優化訓練，填補了葡萄牙語模型的空白

指令微調

基於30萬條葡萄牙語指令數據集進行微調，擅長理解和執行各種指令

多量化支持

提供多種量化版本（4位、8位、16位等），適應不同硬件需求

模型能力

葡萄牙語文本生成

問答系統

指令執行

文本分類

語義相似度計算

使用案例

教育

ENEM考試輔助

幫助學生解答ENEM考試相關問題

在ENEM挑戰賽數據集上達到61.58%準確率

法律

OAB考試輔助

解答巴西律師資格考試相關問題

在OAB考試數據集上達到43.69%準確率

社交媒體分析

仇恨言論檢測

識別葡萄牙語中的仇恨言論

在HateBR數據集上達到83.01%宏F1值

🚀 Phi-3-portuguese-tom-cat-4k-instruct

本模型基於300,000條葡萄牙語指令的超集進行訓練，旨在填補葡萄牙語模型的空白。它是從microsoft/Phi-3-mini-4k微調而來。

🚀 快速開始

模型使用環境建議

完整模型：建議使用A100。
半精度模型：可使用L4。
8位或4位量化：T4或V100即可。

安裝依賴

!pip install -q -U transformers
!pip install -q -U accelerate
!pip install -q -U bitsandbytes

加載模型和分詞器

from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
model = AutoModelForCausalLM.from_pretrained("rhaymison/phi-3-portuguese-tom-cat-4k-instruct", device_map= {"": 0})
tokenizer = AutoTokenizer.from_pretrained("rhaymison/phi-3-portuguese-tom-cat-4k-instruct")
model.eval()

使用Pipeline進行文本生成

from transformers import pipeline
pipe = pipeline("text-generation",
                model=model,
                tokenizer=tokenizer,
                do_sample=True,
                max_new_tokens=512,
                num_beams=2,
                temperature=0.3,
                top_k=50,
                top_p=0.95,
                early_stopping=True,
                pad_token_id=tokenizer.eos_token_id,
                )


def format_template(question:str):
    system_prompt = "Abaixo está uma instrução que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto. Escreva uma resposta que complete adequadamente o pedido."
    return f"""<s><|system|>
    { system_prompt }
    <|user|>
    { question }
    <|assistant|>
    """

question = format_template("E possivel ir de Carro dos Estados unidos ate o japão")
pipe(question)

4位量化示例

如果你遇到“CUDA Out of memory”等內存問題，可使用4位或8位量化。

from transformers import BitsAndBytesConfig
import torch
nb_4bit_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16,
    bnb_4bit_use_double_quant=True
)

model = AutoModelForCausalLM.from_pretrained(
    base_model,
    quantization_config=bnb_config,
    device_map={"": 0}
)

✨ 主要特性

基於300,000條葡萄牙語指令的超集進行訓練，有助於填補葡萄牙語模型的空白。
可進行正常形式的使用，也支持到4位量化。
有對應的GGUF家族模型，可使用LlamaCpp運行，增強了兼容性。

📦 安裝指南

使用該模型前，需要安裝以下依賴：

!pip install -q -U transformers
!pip install -q -U accelerate
!pip install -q -U bitsandbytes

💻 使用示例

基礎用法

# 安裝依賴
!pip install -q -U transformers
!pip install -q -U accelerate
!pip install -q -U bitsandbytes

# 加載模型和分詞器
from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
model = AutoModelForCausalLM.from_pretrained("rhaymison/phi-3-portuguese-tom-cat-4k-instruct", device_map= {"": 0})
tokenizer = AutoTokenizer.from_pretrained("rhaymison/phi-3-portuguese-tom-cat-4k-instruct")
model.eval()

# 使用Pipeline進行文本生成
from transformers import pipeline
pipe = pipeline("text-generation",
                model=model,
                tokenizer=tokenizer,
                do_sample=True,
                max_new_tokens=512,
                num_beams=2,
                temperature=0.3,
                top_k=50,
                top_p=0.95,
                early_stopping=True,
                pad_token_id=tokenizer.eos_token_id,
                )

def format_template(question:str):
    system_prompt = "Abaixo está uma instrução que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto. Escreva uma resposta que complete adequadamente o pedido."
    return f"""<s><|system|>
    { system_prompt }
    <|user|>
    { question }
    <|assistant|>
    """

question = format_template("E possivel ir de Carro dos Estados unidos ate o japão")
pipe(question)

高級用法

如果你遇到“CUDA Out of memory”等內存問題，可使用4位或8位量化：

from transformers import BitsAndBytesConfig
import torch
nb_4bit_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16,
    bnb_4bit_use_double_quant=True
)

model = AutoModelForCausalLM.from_pretrained(
    base_model,
    quantization_config=bnb_config,
    device_map={"": 0}
)

📚 詳細文檔

模型相關信息

屬性	詳情
模型類型	phi-3-portuguese-tom-cat-4k-instruct
基礎模型	microsoft/Phi-3-mini-4k-instruct
訓練數據	rhaymison/superset
許可證	apache-2.0

其他GGUF模型

如果你需要增強兼容性，Luana模型也有可以使用LlamaCpp運行的GGUF家族模型：

評估結果

詳細的評估結果可以在這裡和🚀 Open Portuguese LLM Leaderboard找到。

指標	值
平均值	64.57
ENEM Challenge (No Images)	61.58
BLUEX (No Images)	50.63
OAB Exams	43.69
Assin2 RTE	91.54
Assin2 STS	75.27
FaQuAD NLI	47.46
HateBR Binary	83.01
PT Hate Speech Binary	70.19
tweetSentBR	57.78