Llama-3-Instruct-8B开源语言模型 - 免费部署助力高效文本生成

首页

Llama 3 Instruct 8B SimPO SPPO Iter3 Merge

由 grimjim 开发

这是一个基于Meta Llama 3构建的合并预训练语言模型，结合了SimPO和SPPO-Iter3两个模型的优势，适用于文本生成任务。

大型语言模型

Transformers

#指令微调优化 #SLERP混合模型 #多任务文本生成

下载量 8,305

发布时间 : 6/28/2024

模型简介

该模型通过合并princeton-nlp/Llama-3-Instruct-8B-SimPO和UCLA-AGI/Llama-3-Instruct-8B-SPPO-Iter3两个预训练语言模型得到，使用SLERP合并方法，旨在提升文本生成性能。

模型特点

模型合并技术

使用SLERP合并方法结合了SimPO和SPPO-Iter3两个模型的优势

高效文本生成

专注于指令跟随和高质量文本生成能力

参数优化

通过合并不同优化方法的模型，提升整体性能

模型能力

文本生成

指令跟随

自然语言理解

使用案例

文本生成

指令响应生成

根据用户指令生成合适的文本响应

在IFEval基准测试中达到68.06分

问答系统

回答用户提出的各种问题

在BBH基准测试中达到29.07分

教育

数学问题解答

解决数学问题

在MATH Lvl 5基准测试中达到6.19分

指标	值
平均值	23.59
IFEval (0-Shot)	68.06
BBH (3-Shot)	29.07
MATH Lvl 5 (4-Shot)	6.19
GPQA (0-shot)	1.68
MuSR (0-shot)	6.70
MMLU-PRO (5-shot)	29.83

属性	详情
模型类型	合并预训练语言模型
基础模型	princeton-nlp/Llama-3-Instruct-8B-SimPO、UCLA-AGI/Llama-3-Instruct-8B-SPPO-Iter3
管道标签	文本生成
模型名称	Llama-3-Instruct-8B-SimPO-SPPO-Iter3-merge

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Llama 3 Instruct 8B SimPO SPPO Iter3 Merge

模型简介

模型特点

模型能力

使用案例

🚀 Llama-3-Instruct-8B-SimPO-SPPO-Iter3-merge

🚀 快速开始

✨ 主要特性

📚 详细文档

合并详情

合并方法

合并的模型

配置

Open LLM Leaderboard 评估结果

📄 许可证

模型信息表格