maestrale-chat-v0.3-beta開源意大利語對話模型

首頁

Maestrale Chat V0.3 Beta

由mii-llm開發

基於Mistral-7b的意大利語對話模型，經過三階段監督微調和KTO對齊

大型語言模型

Transformers

其他#意大利語對話 #函數調用 #Mistral優化

下載量 2,614

發布時間 : 4/4/2024

模型概述

這是一個專注於意大利語對話的AI助手模型，基於Mistral-7b架構開發，經過精選意大利語料庫的持續預訓練和精細調優，具備流暢的對話能力。

模型特點

意大利語優化

在精選的大規模高質量意大利語料庫上進行持續預訓練和微調

多階段微調

經過三階段的監督微調(SFT)和KTO對齊方法優化

函數調用支持

v0.3版本新增函數調用功能

高效提示格式

採用ChatML提示格式，精簡系統提示以減少token浪費

模型能力

意大利語對話生成

指令跟隨

函數調用

使用案例

對話助手

意大利語客服機器人

用於處理意大利語客戶的諮詢和問題解答

語言學習助手

幫助學習意大利語的學生進行對話練習

🚀 馬埃斯特rale聊天測試版 ༄

馬埃斯特rale聊天測試版是一款專為意大利語設計的語言模型，基於Mistral - 7b進行持續預訓練和微調，能為用戶提供高質量的意大利語對話服務。

🚀 快速開始

本模型使用ChatML提示格式，以下是使用示例：

<|im_start|>system
Sei un assistente utile.<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

以下是Python代碼示例，展示如何使用該模型：

from transformers import (
    AutoTokenizer, 
    AutoModelForCausalLM, 
    GenerationConfig,
    TextStreamer
)
import torch

tokenizer = AutoTokenizer.from_pretrained("mii-llm/maestrale-chat-v0.3-beta")
model = AutoModelForCausalLM.from_pretrained("mii-llm/maestrale-chat-v0.3-beta", load_in_8bit=True, device_map="auto")

gen = GenerationConfig(
    do_sample=True,
    temperature=0.7,
    repetition_penalty=1.2,
    top_k=50,
    top_p=0.95,
    max_new_tokens=500,
    pad_token_id=tokenizer.eos_token_id,
    eos_token_id=tokenizer.convert_tokens_to_ids("<|im_end|>")
)

streamer = TextStreamer(tokenizer, skip_prompt=True)

messages = [
    {"role": "system", "content": "Sei un assistente utile."},
    {"role": "user", "content": "{prompt}"}
]

with torch.no_grad():
    temp = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
    inputs = tokenizer(temp, return_tensors="pt").to("cuda")

    _ = model.generate(
        **inputs,
        streamer=streamer,
        generation_config=gen
    )

✨ 主要特性

語言模型：基於Mistral - 7b專為意大利語打造，在精心策劃的大規模高質量意大利語語料庫上進行持續預訓練。
微調：在對話/指令上進行了三個週期的SFT微調。
KTO對齊：與KTO對齊。
v0.3版本特性：
- 支持函數調用。
- 減少默認系統提示，避免浪費令牌（預對齊）。

📚 詳細文檔

模型描述

該模型是針對意大利語的Mistral - 7b語言模型，在特定的大規模高質量意大利語語料庫上進行了持續預訓練，並進行了三個週期的SFT微調，同時與KTO對齊。v0.3版本增加了函數調用功能，並對默認系統提示進行了優化。

📄 許可證

本模型使用CC - BY - NC - 4.0許可證。

模型信息表格

屬性	詳情
模型名稱	maestrale - chat - v0.3 - beta
語言模型	針對意大利語的Mistral - 7b，在精心策劃的大規模高質量意大利語語料庫上進行持續預訓練
微調	在對話/指令上進行三個週期的SFT微調
KTO對齊	與KTO對齊
版本特性（v0.3）	支持函數調用；減少默認系統提示以避免浪費令牌（預對齊）
提示模板	`<
許可證	CC - BY - NC - 4.0
標籤	sft、it、mistral、chatml、axolotl、kpo