Dorna-Llama3-8B-Instruct开源模型 - 专为波斯语优化的指令微调利器

首页

Dorna Llama3 8B Instruct

由 PartAI 开发

Dorna-Llama3-8B-Instruct是由Part AI开发的基于Meta Llama 3的8B参数指令微调模型，专门针对波斯语优化。

大型语言模型

Transformers

支持多种语言#波斯语优化 #多轮对话 #指令微调

下载量 1,746

发布时间 : 6/1/2024

模型简介

该模型是基于Meta-Llama-3-8B-Instruct的仅解码器架构模型，针对波斯语数据进行了训练和微调，支持英语和波斯语的双语对话。

模型特点

波斯语优化

专门针对波斯语数据进行训练和微调，在波斯语任务上表现优异。

双语支持

同时支持英语和波斯语，能根据用户提问语言自动切换回答语言。

指令微调

基于Meta-Llama-3-8B-Instruct进行指令微调，擅长遵循复杂指令。

模型能力

波斯语文本生成

英语文本生成

对话系统

问答系统

代码生成

文本摘要

文本改写

使用案例

教育

波斯语学习助手

帮助学习者练习波斯语对话和写作

在波斯语问答任务中表现优异

客服

双语客服机器人

为波斯语和英语用户提供自动客服支持

在对话任务中胜率超过GPT-3.5 turbo

🚀 Dorna-Llama3-8B-Instruct模型

Dorna-Llama3-8B-Instruct是由Part AI开发的解码器模型，基于波斯语数据进行训练和微调。此初始版本为8B指令模型，构建于Meta Llama 3 Instruct模型之上。

💬 参与社区讨论

🚀 快速开始

💻 使用示例

基础用法

import torch
import transformers
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForCausalLM.from_pretrained(
    model_path,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)

messages = [
    {"role": "system",
     "content": "You are a helpful Persian assistant. Please answer questions in the asked language."},
    {"role": "user", "content": "کاغذ A4 بزرگ تر است یا A5؟"},
]

input_ids = tokenizer.apply_chat_template(
    messages,
    add_generation_prompt=True,
    return_tensors="pt"
).to(model.device)

terminators = [
    tokenizer.eos_token_id,
    tokenizer.convert_tokens_to_ids("<|eot_id|>")
]

outputs = model.generate(
    input_ids,
    max_new_tokens=256,
    eos_token_id=terminators,
    do_sample=True,
    temperature=0.6,
    top_p=0.9,
)
response = outputs[0][input_ids.shape[-1]:]
print(tokenizer.decode(response, skip_special_tokens=True))

你也可以使用下面的笔记本在Google Colab中测试该模型。

📚 详细文档

模型详情

Dorna系列模型是仅解码器模型家族，专门针对波斯语数据进行训练和微调，由Part AI开发。作为初始版本，现推出该家族的8B指令模型。 Dorna-Llama3-8B-Instruct基于Meta Llama 3 Instruct模型构建。

评估

该模型在各种任务的问题上进行了评估，包括布尔问题、代码生成、长文本回复、数学问题、新闻问答、释义、常识问答和文本摘要。大多数类别通常有两个主要难度级别：困难和简单。

评估包括人工评估和自动评估（以GPT - 4作为评判）。

在两个表格中，Dorna-8B-it 是 Dorna-Llama3-8B-Instruct 的缩写形式。

整体人工评估结果

模型对比	参数	胜率 %	败率 %	平局率 %
Dorna-8B-it vs. Meta-Llama-3-8B-Instruct	8B	36.94	17.39	45.67
Dorna-8B-it vs. GPT 3.5 turbo-1106	N.A.	32.01	26.94	41.05
Dorna-8B-it vs. Persian Mind	7B	55.77	10.49	33.74

分类人工评估结果

每个类别报告了胜/败/平的百分比。

模型对比	参数	复杂布尔问题	简单布尔问题	代码生成	通用长回复	历史长回复	复杂数学问题	简单数学问题	复杂新闻问答	简单新闻问答	释义	简单常识问答	困难常识问答	文本摘要
Dorna-8B-it vs. Meta-Llama-3-8B-Instruct	8B	0.25/0.25/0.5	0.28/0.35/0.38	0.6/0.1/0.3	0.8/0.08/0.12	0.4/0.3/0.3	0.28/0.08/0.65	0.47/0.00/0.53	0.55/0.07/0.38	0.43/0.15/0.42	0.1/0.05/0.85	0.31/0.2/0.49	0.59/0.13/0.28	0.28/0.2/0.53
Dorna-8B-it vs. GPT 3.5 turbo-1106	N.A.	0.35/0.35/0.3	0.3/0.3/0.4	0.1/0.3/.06	0.2/0.45/0.35	0.46/0.27/0.27	0.25/0.1/0.65	0.05/0.1/0.85	0.12/0.35/0.53	0.15/0.1/0.75	0.25/0.15/0.6	0.3/0.32/0.38	0.22/0.53/0.25	0.35/0.55/0.1
Dorna-8B-it vs. Persian Mind	7B	0.47/0.25/0.28	0.57/0.15/0.28	0.9/0.1/0.0	0.82/0.08/0.1	0.4/0.17/0.42	0.3/0.0/0.7	0.22/0.08/0.7	0.72/0.07/0.2	0.7/0.0/0.3	0.7/0.05/0.25	0.51/0.12/0.37	0.61/0.1/0.29	0.93/0.0/0.07

自动评估结果

模型对比	参数	总体胜率 %	简单问题胜率 %	困难问题胜率 %
Dorna-8B-it vs. Llama 3 base	8B	58.96	56.00	64.49
Dorna-8B-it vs. Part Mistral	7B	77.20	73.00	85.05
Dorna-8B-it vs. Persian Mind	7B	90.88	87.50	97.20
Dorna-8B-it vs. Neuraorca Gemma 7b	7B	86.32	86.50	85.98
Dorna-8B-it vs. Maral 7b	7B	97.39	97.00	98.13
Dorna-8B-it vs. PersianLlama 7b	7B	98.70	98.00	100.00
Dorna-8B-it vs. Aya-23-8B	8B	52.77	56.50	45.79
Dorna-8B-it vs. Aya-23-35B	35B	45.93	54.00	30.84
Dorna-8B-it vs. Command R	35B	58.63	61.00	54.21