Minueza-32M-Chat开源聊天模型 - 免费部署实现智能友好对话交流

首页

Minueza 32M Chat

由 Felladrin 开发

Minueza-32M-Chat是一个拥有3200万参数的聊天模型，基于Felladrin/Minueza-32M-Base进行监督微调(SFT)和直接偏好优化(DPO)训练。

大型语言模型

Transformers

英语开源协议:Apache-2.0 #多轮对话优化 #轻量级聊天模型 #多领域适应性

下载量 77

发布时间 : 2/25/2024

模型简介

这是一个小型但高效的聊天模型，适用于多种对话场景，能够提供有帮助的响应和建议。

模型特点

小型高效

虽然只有3200万参数，但通过精心训练实现了不错的对话能力

多数据集训练

使用了包括Dolly、WebGLM、Capybara等多个高质量数据集进行训练

直接偏好优化

采用DPO训练方法优化了模型响应质量

模型能力

文本生成

对话交互

问答系统

创意写作

职业咨询

健康建议

使用案例

对话系统

职业咨询

为用户提供职业发展建议和指导

根据用户技能和兴趣提供个性化职业建议

知识问答

健康建议

回答关于健康生活方式的问题

提供基于常识的健康改善建议

创意生成

游戏设定创作

根据用户要求生成奇幻游戏设定

创造富有想象力的游戏世界和角色

🚀 Minueza-32M-Chat：一个拥有3200万参数的聊天模型

Minueza-32M-Chat是一个参数规模为3200万的聊天模型，它基于特定的基础模型，使用了丰富的数据集进行训练，在文本生成任务上有一定的表现。

🚀 快速开始

使用示例

from transformers import pipeline

generate = pipeline("text-generation", "Felladrin/Minueza-32M-Chat")

messages = [
    {
        "role": "system",
        "content": "You are a helpful assistant who answers the user's questions with details and curiosity.",
    },
    {
        "role": "user",
        "content": "What are some potential applications for quantum computing?",
    },
]

prompt = generate.tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)

output = generate(
    prompt,
    max_new_tokens=256,
    do_sample=True,
    temperature=0.65,
    top_k=35,
    top_p=0.55,
    repetition_penalty=1.176,
)

print(output[0]["generated_text"])

✨ 主要特性

基础模型：基于 Felladrin/Minueza-32M-Base 构建。
多数据集训练：在监督微调（SFT）和直接偏好优化（DPO）阶段使用了多个数据集，包括 databricks/databricks-dolly-15k、euclaise/reddit-instruct-curated 等。
多格式支持：支持 GGUF 和 ONNX 等其他机器学习格式，可在 Felladrin/gguf-Minueza-32M-Chat 和 Felladrin/onnx-Minueza-32M-Chat 查看。

📦 安装指南

文档未提供具体安装步骤，暂不展示。

💻 使用示例

基础用法

from transformers import pipeline

generate = pipeline("text-generation", "Felladrin/Minueza-32M-Chat")

messages = [
    {
        "role": "system",
        "content": "You are a helpful assistant who answers the user's questions with details and curiosity.",
    },
    {
        "role": "user",
        "content": "What are some potential applications for quantum computing?",
    },
]

prompt = generate.tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)

output = generate(
    prompt,
    max_new_tokens=256,
    do_sample=True,
    temperature=0.65,
    top_k=35,
    top_p=0.55,
    repetition_penalty=1.176,
)

print(output[0]["generated_text"])

📚 详细文档

训练使用的数据集

监督微调（SFT）阶段使用的数据集

直接偏好优化（DPO）阶段使用的数据集

训练设置

监督微调

超参数	值
learning_rate	2e-5
total_train_batch_size	24
max_seq_length	2048
weight_decay	0
warmup_ratio	0.02

直接偏好优化

超参数	值
learning_rate	7.5e-7
total_train_batch_size	6
max_length	2048
max_prompt_length	1536
max_steps	200
weight_decay	0
warmup_ratio	0.02
beta	0.1

评估结果

Open LLM Leaderboard评估结果详细结果可查看此处

指标	值
平均（Avg.）	28.49
AI2 Reasoning Challenge (25-Shot)	20.39
HellaSwag (10-Shot)	26.54
MMLU (5-Shot)	25.75
TruthfulQA (0-shot)	47.27
Winogrande (5-shot)	50.99
GSM8k (5-shot)	0.00