Llama 3.1 8b Medusa V1.01
基于Llama 3.1架构的8B参数语言模型,通过mergekit合并多个专业模型而成,在文本生成任务中表现优异。
下载量 95
发布时间 : 2/27/2025
模型简介
这是一个通过合并多个专业模型(Mediver、Smarteaz和Dobby-Mini-Unhinged)而创建的8B参数语言模型,专注于文本生成任务,在多个基准测试中展现出色性能。
模型特点
多模型合并
通过mergekit合并多个专业模型(Mediver、Smarteaz和Dobby-Mini-Unhinged),综合各模型优势
高性能文本生成
在IFEval等文本生成基准测试中表现优异,严格准确率达76.85%
广泛基准测试
在BBH、MATH、GPQA、MuSR和MMLU-PRO等多个基准测试中进行评估
模型能力
文本生成
指令跟随
知识问答
数学推理
使用案例
教育
数学问题解答
解答各类数学问题,特别是竞赛级别题目
在MATH Lvl 5测试中获得14.65%的精确匹配率
研究
复杂问题研究
协助研究人员处理GPQA等复杂科学问题
在GPQA测试中获得5.59%的归一化准确率
通用AI助手
指令执行
准确理解和执行复杂指令
在IFEval测试中获得76.85%的严格准确率
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98