Llama_3.1_8b_Medusa_v1.01開源語言模型 - 出色完成各類文本生成任務

首頁

Llama 3.1 8b Medusa V1.01

由Nexesenex開發

基於Llama 3.1架構的8B參數語言模型，通過mergekit合併多個專業模型而成，在文本生成任務中表現優異。

大型語言模型

Transformers

#指令微調 #多任務泛化 #零樣本推理

下載量 95

發布時間 : 2/27/2025

模型概述

這是一個通過合併多個專業模型（Mediver、Smarteaz和Dobby-Mini-Unhinged）而創建的8B參數語言模型，專注於文本生成任務，在多個基準測試中展現出色性能。

模型特點

多模型合併

通過mergekit合併多個專業模型（Mediver、Smarteaz和Dobby-Mini-Unhinged），綜合各模型優勢

高性能文本生成

在IFEval等文本生成基準測試中表現優異，嚴格準確率達76.85%

廣泛基準測試

在BBH、MATH、GPQA、MuSR和MMLU-PRO等多個基準測試中進行評估

模型能力

文本生成

指令跟隨

知識問答

數學推理

使用案例

教育

數學問題解答

解答各類數學問題，特別是競賽級別題目

在MATH Lvl 5測試中獲得14.65%的精確匹配率

研究

複雜問題研究

協助研究人員處理GPQA等複雜科學問題

在GPQA測試中獲得5.59%的歸一化準確率

通用AI助手

指令執行

準確理解和執行復雜指令

在IFEval測試中獲得76.85%的嚴格準確率

指標	值
平均	27.38
IFEval (0 - 樣本)	76.85
BBH (3 - 樣本)	30.03
MATH Lvl 5 (4 - 樣本)	14.65
GPQA (0 - 樣本)	5.59
MuSR (0 - 樣本)	9.03
MMLU - PRO (5 - 樣本)	28.13

屬性	詳情
模型類型	合併的預訓練語言模型
訓練數據	未提及

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Llama 3.1 8b Medusa V1.01

模型概述

模型特點

模型能力

使用案例

🚀 Llama_3.1_8b_Medusa_v1.01

📄 許可證

📚 詳細文檔

合併說明

合併方法

合併的模型

配置

Open LLM Leaderboard 評估結果

模型信息表格