zephyr-7b-sft-full开源对话模型 - 免费部署高效畅聊体验

Home

Zephyr 7b Sft Full

Developed by alignment-handbook

基于Mistral-7B在ultrachat_200k数据集上微调的对话模型

大型语言模型

Transformers

Open Source License:Apache-2.0 #对话微调 #7B参数量 #多GPU优化

Downloads 8,567

Release Time : 11/9/2023

Model Overview

该模型是基于Mistral-7B架构的大语言模型，经过监督微调(SFT)优化，专注于对话生成任务。

Model Features

监督微调优化

使用ultrachat_200k对话数据集进行监督微调，提升对话生成质量

高效训练

采用多GPU分布式训练，优化训练效率

优化策略

使用余弦退火学习率调度和预热策略，提高训练稳定性

Model Capabilities

对话生成

文本补全

指令跟随

Use Cases

对话系统

智能助手

可用于构建智能对话助手

客服机器人

适用于构建自动化客服系统

文本生成

内容创作

辅助进行创意写作和内容生成

训练损失	轮数	步数	验证损失
0.9075	1.0	1090	0.9353

属性	详情
基础模型	mistralai/Mistral-7B-v0.1
训练数据集	HuggingFaceH4/ultrachat_200k
标签	alignment - handbook、generated_from_trainer、trl、sft、generated_from_trainer

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Zephyr 7b Sft Full

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 zephyr-7b-sft-full

🚀 快速开始

📚 详细文档

训练过程

训练超参数

训练结果

框架版本

📄 许可证

📦 模型信息