Llama-3-Instruct-8B開源語言模型 - 免費部署助力高效文本生成

Home

Llama 3 Instruct 8B SimPO SPPO Iter3 Merge

Developed by grimjim

這是一個基於Meta Llama 3構建的合併預訓練語言模型，結合了SimPO和SPPO-Iter3兩個模型的優勢，適用於文本生成任務。

大型語言模型

Transformers

#指令微調優化 #SLERP混合模型 #多任務文本生成

Downloads 8,305

Release Time : 6/28/2024

Model Overview

該模型通過合併princeton-nlp/Llama-3-Instruct-8B-SimPO和UCLA-AGI/Llama-3-Instruct-8B-SPPO-Iter3兩個預訓練語言模型得到，使用SLERP合併方法，旨在提升文本生成性能。

Model Features

模型合併技術

使用SLERP合併方法結合了SimPO和SPPO-Iter3兩個模型的優勢

高效文本生成

專注於指令跟隨和高質量文本生成能力

參數優化

通過合併不同優化方法的模型，提升整體性能

Model Capabilities

文本生成

指令跟隨

自然語言理解

Use Cases

文本生成

指令響應生成

根據用戶指令生成合適的文本響應

在IFEval基準測試中達到68.06分

問答系統

回答用戶提出的各種問題

在BBH基準測試中達到29.07分

教育

數學問題解答

解決數學問題

在MATH Lvl 5基準測試中達到6.19分

指標	值
平均值	23.59
IFEval (0-Shot)	68.06
BBH (3-Shot)	29.07
MATH Lvl 5 (4-Shot)	6.19
GPQA (0-shot)	1.68
MuSR (0-shot)	6.70
MMLU-PRO (5-shot)	29.83

屬性	詳情
模型類型	合併預訓練語言模型
基礎模型	princeton-nlp/Llama-3-Instruct-8B-SimPO、UCLA-AGI/Llama-3-Instruct-8B-SPPO-Iter3
管道標籤	文本生成
模型名稱	Llama-3-Instruct-8B-SimPO-SPPO-Iter3-merge

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Llama 3 Instruct 8B SimPO SPPO Iter3 Merge

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 Llama-3-Instruct-8B-SimPO-SPPO-Iter3-merge

🚀 快速開始

✨ 主要特性

📚 詳細文檔

合併詳情

合併方法

合併的模型

配置

Open LLM Leaderboard 評估結果

📄 許可證

模型信息表格