Moxin-7B-LLM开源大语言模型 - 免费获取多类型模型，多数据集表现出色

首页

Moxin 7B LLM

由 moxin-org 开发

Moxin 7B是一款强大的开源大语言模型，提供基础模型和聊天模型等多种类型，在多个常见数据集上展现出了良好的性能。

大型语言模型

Transformers

开源协议:Apache-2.0 #多任务微调 #零样本推理 #高性能评估

下载量 134

发布时间 : 12/4/2024

模型简介

Moxin 7B大语言模型可用于文本生成等任务，支持多种模型类型，包括基础模型、聊天模型、指令模型、推理模型和视觉语言模型（VLM）。

模型特点

多种模型类型

提供基础模型、聊天模型、指令模型、推理模型和视觉语言模型（VLM）等多种类型，满足不同需求。

高性能

在多个常见数据集上进行了评估，展现出了良好的性能，与其他主流7B模型相比具有竞争力。

易用性

可使用transformers库进行推理，代码简洁易用，支持Huggingface模型下载。

模型能力

文本生成

对话交互

指令理解

逻辑推理

使用案例

教育

概念解释

解释机器学习中的正则化等概念

生成清晰易懂的概念解释文本

研究

技术报告生成

辅助研究人员撰写技术报告

生成结构完整的技术内容

🚀 Moxin 7B大语言模型

Moxin 7B大语言模型是一款强大的语言模型，提供了基础模型、聊天模型等多种类型，可用于文本生成等任务，在多个常见数据集上展现出了良好的性能。

🚀 快速开始

你可以从以下链接下载我们的7B基础模型链接和7B聊天模型链接。

✨ 主要特性

提供多种模型类型，包括基础模型、聊天模型、指令模型、推理模型和视觉语言模型（VLM）。
可使用transformers库进行推理，代码简洁易用。
在多个常见数据集上进行了评估，展现出了良好的性能。

📦 安装指南

文档未提及具体安装步骤，可参考transformers库的官方安装指南进行安装。

💻 使用示例

基础用法

你可以使用以下代码对模型进行推理。模型保存在./model/目录下。可相应更改模型目录或使用Huggingface链接。

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline

torch.backends.cuda.enable_mem_efficient_sdp(False)
torch.backends.cuda.enable_flash_sdp(False)


model_name = 'moxin-org/Moxin-7B-LLM'
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
        model_name,
        torch_dtype=torch.bfloat16,
        device_map="auto",
        trust_remote_code=True,
    )

pipe = pipeline(
    "text-generation",
    model=model,
    tokenizer = tokenizer,
    torch_dtype=torch.bfloat16,
    device_map="auto"
)

prompt = "Can you explain the concept of regularization in machine learning?"

sequences = pipe(
    prompt,
    do_sample=True,
    max_new_tokens=1000,
    temperature=0.7,
    top_k=50,
    top_p=0.95,
    num_return_sequences=1,
)
print(sequences[0]['generated_text'])

📚 详细文档

评估

我们使用 lm-evaluation-harness 对模型的性能进行了测试。以下是在常见数据集上的评估结果。我们在AI2推理挑战（25-shot）、HellaSwag（10-shot）、MMLU（5-shot）和Winogrande（5-shot）上进行了测试。我们发布了Moxin-7B微调后的模型作为基础模型。我们进一步在Tulu v2上对基础模型进行微调，得到了聊天模型。

模型	ARC-C	Hellaswag	MMLU	WinoGrade	平均
Mistral-7B	57.59	83.25	62.42	78.77	70.51
LLaMA 3.1-8B	54.61	81.95	65.16	77.35	69.77
LLaMA 3-8B	55.46	82.09	65.29	77.82	70.17
LLaMA 2-7B	49.74	78.94	45.89	74.27	62.21
Qwen 2-7B	57.68	80.76	70.42	77.43	71.57
gemma-7b	56.48	82.31	63.02	78.3	70.03
internlm2.5-7b	54.78	79.7	68.17	80.9	70.89
Baichuan2-7B	47.87	73.89	54.13	70.8	61.67
Yi-1.5-9B	58.36	80.36	69.54	77.53	71.48
Moxin-7B-original	53.75	75.46	59.43	70.32	64.74
Moxin-7B-finetuned	59.47	83.08	60.97	78.69	70.55

我们还测试了模型在AI2推理挑战（0-shot）、AI2推理简易版（0-shot）、HellaSwag（0-shot）、PIQA（0-shot）和Winogrande（0-shot）上的零样本性能。结果如下。

模型	HellaSwag	WinoGrade	PIQA	ARC-E	ARC-C	平均
Mistral-7B	80.39	73.4	82.15	78.28	52.22	73.29
LLaMA 2-7B	75.99	69.06	79.11	74.54	46.42	69.02
LLaMA 2-13B	79.37	72.22	80.52	77.4	49.06	71.71
LLaMA 3.1-8B	78.92	74.19	81.12	81.06	53.67	73.79
gemma-7b	80.45	73.72	80.9	79.97	54.1	73.83
Qwen v2-7B	78.9	72.38	79.98	74.71	50.09	71.21
internlm2.5-7b	79.14	77.9	80.52	76.16	51.37	73.02
Baichuan2-7B	72.25	67.17	77.26	72.98	42.15	66.36
Yi-1.5-9B	77.86	73.01	80.74	79.04	55.03	73.14
deepseek-7b	76.13	69.77	79.76	71.04	44.8	68.3
Moxin-7B-original	72.06	66.31	78.07	71.47	48.15	67.21
Moxin-7B-finetune	80.03	75.17	82.24	81.12	58.64	75.44

引用

@article{zhao2024fully,
  title={Fully Open Source Moxin-7B Technical Report},
  author={Zhao, Pu and Shen, Xuan and Kong, Zhenglun and Shen, Yixin and Chang, Sung-En and Rupprecht, Timothy and Lu, Lei and Nan, Enfu and Yang, Changdi and He, Yumei and others},
  journal={arXiv preprint arXiv:2412.06845},
  year={2024}
}