Minueza-32M-Chat開源聊天模型 - 免費部署實現智能友好對話交流

首頁

Minueza 32M Chat

由Felladrin開發

Minueza-32M-Chat是一個擁有3200萬參數的聊天模型，基於Felladrin/Minueza-32M-Base進行監督微調(SFT)和直接偏好優化(DPO)訓練。

大型語言模型

Transformers

英語開源協議:Apache-2.0 #多輪對話優化 #輕量級聊天模型 #多領域適應性

下載量 77

發布時間 : 2/25/2024

模型概述

這是一個小型但高效的聊天模型，適用於多種對話場景，能夠提供有幫助的響應和建議。

模型特點

小型高效

雖然只有3200萬參數，但通過精心訓練實現了不錯的對話能力

多數據集訓練

使用了包括Dolly、WebGLM、Capybara等多個高質量數據集進行訓練

直接偏好優化

採用DPO訓練方法優化了模型響應質量

模型能力

文本生成

對話交互

問答系統

創意寫作

職業諮詢

健康建議

使用案例

對話系統

職業諮詢

為用戶提供職業發展建議和指導

根據用戶技能和興趣提供個性化職業建議

知識問答

健康建議

回答關於健康生活方式的問題

提供基於常識的健康改善建議

創意生成

遊戲設定創作

根據用戶要求生成奇幻遊戲設定

創造富有想象力的遊戲世界和角色

🚀 Minueza-32M-Chat：一個擁有3200萬參數的聊天模型

Minueza-32M-Chat是一個參數規模為3200萬的聊天模型，它基於特定的基礎模型，使用了豐富的數據集進行訓練，在文本生成任務上有一定的表現。

🚀 快速開始

使用示例

from transformers import pipeline

generate = pipeline("text-generation", "Felladrin/Minueza-32M-Chat")

messages = [
    {
        "role": "system",
        "content": "You are a helpful assistant who answers the user's questions with details and curiosity.",
    },
    {
        "role": "user",
        "content": "What are some potential applications for quantum computing?",
    },
]

prompt = generate.tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)

output = generate(
    prompt,
    max_new_tokens=256,
    do_sample=True,
    temperature=0.65,
    top_k=35,
    top_p=0.55,
    repetition_penalty=1.176,
)

print(output[0]["generated_text"])

✨ 主要特性

基礎模型：基於 Felladrin/Minueza-32M-Base 構建。
多數據集訓練：在監督微調（SFT）和直接偏好優化（DPO）階段使用了多個數據集，包括 databricks/databricks-dolly-15k、euclaise/reddit-instruct-curated 等。
多格式支持：支持 GGUF 和 ONNX 等其他機器學習格式，可在 Felladrin/gguf-Minueza-32M-Chat 和 Felladrin/onnx-Minueza-32M-Chat 查看。

📦 安裝指南

文檔未提供具體安裝步驟，暫不展示。

💻 使用示例

基礎用法

from transformers import pipeline

generate = pipeline("text-generation", "Felladrin/Minueza-32M-Chat")

messages = [
    {
        "role": "system",
        "content": "You are a helpful assistant who answers the user's questions with details and curiosity.",
    },
    {
        "role": "user",
        "content": "What are some potential applications for quantum computing?",
    },
]

prompt = generate.tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)

output = generate(
    prompt,
    max_new_tokens=256,
    do_sample=True,
    temperature=0.65,
    top_k=35,
    top_p=0.55,
    repetition_penalty=1.176,
)

print(output[0]["generated_text"])

📚 詳細文檔

訓練使用的數據集

監督微調（SFT）階段使用的數據集

直接偏好優化（DPO）階段使用的數據集

訓練設置

監督微調

超參數	值
learning_rate	2e-5
total_train_batch_size	24
max_seq_length	2048
weight_decay	0
warmup_ratio	0.02

直接偏好優化

超參數	值
learning_rate	7.5e-7
total_train_batch_size	6
max_length	2048
max_prompt_length	1536
max_steps	200
weight_decay	0
warmup_ratio	0.02
beta	0.1

評估結果

Open LLM Leaderboard評估結果詳細結果可查看此處

指標	值
平均（Avg.）	28.49
AI2 Reasoning Challenge (25-Shot)	20.39
HellaSwag (10-Shot)	26.54
MMLU (5-Shot)	25.75
TruthfulQA (0-shot)	47.27
Winogrande (5-shot)	50.99
GSM8k (5-shot)	0.00