NeuralLLaMa-3-8b-ORPO-v0.3开源语言模型 - 优化版擅于西班牙语文本生成

首页

Neuralllama 3 8b ORPO V0.3

由 Kukedlc 开发

基于meta-llama/Meta-Llama-3.1-8B-Instruct优化的语言模型，擅长西班牙语文本生成

大型语言模型

Transformers

开源协议:Apache-2.0 #西班牙语生成 #低资源优化 #艺术创意辅助

下载量 11.62k

发布时间 : 5/14/2024

模型简介

一款高性能的西班牙语文本生成模型，具备艺术创作和工程图表混合生成能力

模型特点

西班牙语优化

专门针对西班牙语进行优化，生成流畅准确的西班牙语文本

艺术创作能力

能够生成包含ASCII艺术、工程图表等混合形式的创意内容

4位量化支持

支持4位量化技术，降低硬件需求

模型能力

西班牙语文本生成

创意内容创作

ASCII艺术生成

工程图表生成

对话系统

使用案例

创意写作

ASCII艺术创作

生成包含工程元素的ASCII艺术作品

混合艺术与技术的独特表现形式

教育

西班牙语学习辅助

生成西班牙语学习材料和练习内容

🚀 NeuralLLaMa-3-8b-ORPO-v0.3

NeuralLLaMa-3-8b-ORPO-v0.3 是一款基于 meta-llama/Meta-Llama-3.1-8B-Instruct 的语言模型。它在多个文本生成任务中表现出色，能够为用户提供高质量的文本生成服务。

🚀 快速开始

以下是使用 NeuralLLaMa-3-8b-ORPO-v0.3 模型的快速开始步骤：

安装依赖

!pip install -qU transformers accelerate bitsandbytes

加载模型和分词器

from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer, BitsAndBytesConfig
import torch

bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_use_double_quant=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16
)

MODEL_NAME = 'Kukedlc/NeuralLLaMa-3-8b-ORPO-v0.3'
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
model = AutoModelForCausalLM.from_pretrained(MODEL_NAME, device_map='cuda:0', quantization_config=bnb_config)

构建输入提示

prompt_system = "Sos un modelo de lenguaje de avanzada que habla espa√±ol de manera fluida, clara y precisa.\
Te llamas Roberto el Robot y sos un aspirante a artista post moderno"
prompt = "Creame una obra de arte que represente tu imagen de como te ves vos roberto como un LLm de avanzada, con arte ascii, mezcla diagramas, ingenieria y dejate llevar"
chat = [
    {"role": "system", "content": f"{prompt_system}"},
    {"role": "user", "content": f"{prompt}"},
]

chat = tokenizer.apply_chat_template(chat, tokenize=False, add_generation_prompt=True)
inputs = tokenizer(chat, return_tensors="pt").to('cuda')

生成文本

streamer = TextStreamer(tokenizer)
_ = model.generate(**inputs, streamer=streamer, max_new_tokens=1024, do_sample=True, temperature=0.3, repetition_penalty=1.2, top_p=0.9,)

💻 使用示例

基础用法

!pip install -qU transformers accelerate bitsandbytes

from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer, BitsAndBytesConfig
import torch

bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_use_double_quant=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16
)

MODEL_NAME = 'Kukedlc/NeuralLLaMa-3-8b-ORPO-v0.3'
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
model = AutoModelForCausalLM.from_pretrained(MODEL_NAME, device_map='cuda:0', quantization_config=bnb_config)

prompt_system = "Sos un modelo de lenguaje de avanzada que habla espa√±ol de manera fluida, clara y precisa.\
Te llamas Roberto el Robot y sos un aspirante a artista post moderno"
prompt = "Creame una obra de arte que represente tu imagen de como te ves vos roberto como un LLm de avanzada, con arte ascii, mezcla diagramas, ingenieria y dejate llevar"
chat = [
    {"role": "system", "content": f"{prompt_system}"},
    {"role": "user", "content": f"{prompt}"},
]

chat = tokenizer.apply_chat_template(chat, tokenize=False, add_generation_prompt=True)
inputs = tokenizer(chat, return_tensors="pt").to('cuda')
streamer = TextStreamer(tokenizer)
_ = model.generate(**inputs, streamer=streamer, max_new_tokens=1024, do_sample=True, temperature=0.3, repetition_penalty=1.2, top_p=0.9,)

📚 详细文档

Open LLM Leaderboard Evaluation Results

详细的评估结果可以在这里找到。

指标	值
平均值	72.66
AI2 Reasoning Challenge (25-Shot)	69.54
HellaSwag (10-Shot)	84.90
MMLU (5-Shot)	68.39
TruthfulQA (0-shot)	60.82
Winogrande (5-shot)	79.40
GSM8k (5-shot)	72.93