InternLm-ChatBode-7b開源語言模型 - 專用於葡萄牙語對話交流優化

首頁

Internlm Chatbode 7b

由recogna-nlp開發

InternLm-ChatBode 是一個針對葡萄牙語進行微調的語言模型，基於 InternLM2 開發，通過 UltraAlpaca 數據集優化。

大型語言模型

Transformers

其他#葡萄牙語優化 #QLoRA微調 #教育問答

下載量 128

發布時間 : 5/7/2024

模型概述

該模型是針對葡萄牙語優化的對話模型，適用於葡萄牙語文本生成和問答任務。

模型特點

葡萄牙語優化

專門針對葡萄牙語進行微調，提升葡萄牙語文本生成質量。

基於 InternLM2

以強大的 InternLM2 為基礎模型，具備優秀的語言理解和生成能力。

QLoRA 微調

使用 QLoRA 技術進行高效微調，平衡性能與資源消耗。

模型能力

葡萄牙語文本生成

葡萄牙語問答

流式文本生成

使用案例

教育

數學概念解釋

解釋數學定理如勾股定理並提供示例

能夠準確解釋概念並提供相關示例

客戶服務

葡萄牙語客服機器人

用於處理葡萄牙語客戶的諮詢

能夠理解並生成自然的葡萄牙語回覆

🚀 internlm-chatbode-7b

InternLm-ChatBode 是一個針對葡萄牙語進行微調的語言模型，它基於 InternLM2 模型開發。該模型通過使用 UltraAlpaca 數據集進行微調得到進一步優化。

ChatBode Logo

✨ 主要特性

基礎模型：internlm/internlm2-chat-7b
微調數據集：UltraAlpaca
訓練方式：使用 QLoRA 對 internlm2-chat-7b 進行微調訓練。

💻 使用示例

基礎用法

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("recogna-nlp/internlm-chatbode-7b", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("recogna-nlp/internlm-chatbode-7b", torch_dtype=torch.float16, trust_remote_code=True).cuda()
model = model.eval()
response, history = model.chat(tokenizer, "Olá", history=[])
print(response)
response, history = model.chat(tokenizer, "O que é o Teorema de Pitágoras? Me dê um exemplo", history=history)
print(response)

高級用法

可以使用 stream_chat 方法以流式方式生成回覆：

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_path = "recogna-nlp/internlm-chatbode-7b"
model = AutoModelForCausalLM.from_pretrained(model_path, torch_dtype=torch.float16, trust_remote_code=True).cuda()
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)

model = model.eval()
length = 0
for response, history in model.stream_chat(tokenizer, "Olá", history=[]):
    print(response[length:], flush=True, end="")
    length = len(response)

📚 詳細文檔

Open Portuguese LLM Leaderboard 評估結果

詳細結果可在此處和 Open Portuguese LLM Leaderboard 上查看。

指標	數值
平均值	69.54
ENEM Challenge (No Images)	63.05
BLUEX (No Images)	51.46
OAB Exams	42.32
Assin2 RTE	91.33
Assin2 STS	80.69
FaQuAD NLI	79.80
HateBR Binary	87.99
PT Hate Speech Binary	68.09
tweetSentBR	61.11

📄 引用

如果您想在研究中使用 Chatbode，請按以下方式引用：

@misc {chatbode_2024,
	author       = { Gabriel Lino Garcia, Pedro Henrique Paiola and  and João Paulo Papa},
	title        = { Chatbode },
	year         = {2024},
	url          = { https://huggingface.co/recogna-nlp/internlm-chatbode-7b/ },
	doi          = { 10.57967/hf/3317 },
	publisher    = { Hugging Face }
}