Einstein-v4-7B开源大语言模型 - 免费部署助力STEM领域任务处理

首页

Einstein V4 7B

由 Weyaxi 开发

Einstein-v4-7B是基于Mistral-7B-v0.1在多样化科学数据集上完整微调的大语言模型，专注于STEM领域任务

大型语言模型

Transformers

英语开源协议:其他 #STEM专家模型 #长上下文推理 #科学问答

下载量 43

发布时间 : 2/22/2024

模型简介

该模型是在Mistral-7B基础上通过多轮微调优化的版本，特别强化了在物理、化学、生物、数学等科学领域的表现，使用了包括AI2推理挑战赛、Camel科学数据集等高质量训练数据

模型特点

科学领域优化

专门针对STEM(科学、技术、工程、数学)领域任务进行微调，在物理、化学、生物等学科表现优异

长上下文支持

支持8192 tokens的长上下文处理能力，适合处理复杂科学问题和推理任务

多数据集融合训练

整合了20+高质量科学数据集，包括AI2推理挑战赛、Camel科学系列、ScienceQA等

ChatML模板支持

内置ChatML对话模板，便于构建对话系统和助手应用

模型能力

科学问题解答

数学推理

物理概念解释

化学方程式生成

生物知识问答

多轮对话

复杂推理

使用案例

教育

科学辅导助手

帮助学生理解STEM学科概念和解决问题

在AI2推理挑战赛上达到64.68%准确率

研究辅助工具

协助研究人员快速获取科学知识和参考资料

评估

科学能力评估

评估学生在STEM领域的知识和推理能力

在MMLU测试中达到62.31%准确率

🚀 🔬 Einstein-v4-7B

Einstein-v4-7B 是 mistralai/Mistral-7B-v0.1 在多种数据集上进行全量微调后的模型。该模型使用 7xRTX3090 + 1xRTXA6000 显卡，借助 axolotl 工具进行微调。其训练由 sablo.ai 赞助。

image/png

🚀 快速开始

此模型可直接使用，你可以按照以下提示进行操作：

提示模板

你可以在使用模型时使用以下提示模板：

ChatML

<|im_start|>system
{system}<|im_end|>
<|im_start|>user
{user}<|im_end|>
<|im_start|>assistant
{asistant}<|im_end|>

这个提示模板可作为聊天模板使用，这意味着你可以使用 tokenizer.apply_chat_template() 方法来格式化消息：

messages = [
    {"role": "system", "content": "You are helpful AI asistant."},
    {"role": "user", "content": "Hello!"}
]
gen_input = tokenizer.apply_chat_template(message, return_tensors="pt")
model.generate(**gen_input)

量化版本

此模型提供了量化版本：

GGUF @LoneStriker

https://huggingface.co/LoneStriker/Einstein-v4-7B-GGUF

AWQ @solidrust

https://huggingface.co/solidrust/Einstein-v4-7B-AWQ

Exl2 @bartowski

https://huggingface.co/bartowski/Einstein-v4-7B-exl2

✨ 主要特性

多数据集微调：基于多个科学相关数据集进行微调，在科学问答、推理等任务上表现出色。
多种量化版本：提供 GGUF、AWQ、Exl2 等量化版本，方便不同场景使用。

📦 安装指南

文档未提供具体安装步骤，暂不展示。

💻 使用示例

文档未提供具体代码示例，暂不展示。

📚 详细文档

模型信息

属性	详情
模型类型	基于 Mistral-7B-v0.1 全量微调的模型
训练数据	allenai/ai2_arc、camel-ai/physics、camel-ai/chemistry 等众多数据集

评估结果

Open LLM Leaderboard 评估结果

详细结果可查看此处

指标	值
平均	66.62
AI2 推理挑战 (25 样本)	64.68
HellaSwag (10 样本)	83.75
MMLU (5 样本)	62.31
TruthfulQA (0 样本)	55.15
Winogrande (5 样本)	76.24
GSM8k (5 样本)	57.62

Open LLM Leaderboard v2 评估结果

详细结果可查看此处

指标	值
平均	16.73
IFEval (0 样本)	47.08
BBH (3 样本)	14.30
MATH Lvl 5 (4 样本)	1.74
GPQA (0 样本)	4.25
MuSR (0 样本)	19.02
MMLU-PRO (5 样本)	13.99

🔧 技术细节

axolotl 配置

查看 axolotl 配置

axolotl 版本：0.4.0

base_model: mistralai/Mistral-7B-v0.1
model_type: MistralForCausalLM
tokenizer_type: LlamaTokenizer
is_mistral_derived_model: true

load_in_8bit: false
load_in_4bit: false
strict: false

chat_template: chatml
datasets:
  - path: data/merged_all.json
    ds_type: json
    type: alpaca
    conversation: chatml

  - path: data/capybara_sharegpt.json
    ds_type: json
    type: sharegpt
    conversation: chatml

  - path: data/synthia-v1.3_sharegpt_12500.json
    ds_type: json
    type: sharegpt
    conversation: chatml  

  - path: data/cot_alpaca_gpt4_extracted_openhermes_2.5_sharegpt.json
    ds_type: json
    type: sharegpt
    conversation: chatml

  - path: data/slimorca_dedup_filtered_95k_sharegpt.json
    ds_type: json
    type: sharegpt
    conversation: chatml  

  - path: data/airoboros_3.2_without_contextual_slimorca_orca_sharegpt.json
    ds_type: json
    type: sharegpt
    conversation: chatml  

dataset_prepared_path: last_run_prepared
val_set_size: 0.005
output_dir: ./Einstein-v4-model

sequence_len: 8192
sample_packing: true
pad_to_sequence_len: true
eval_sample_packing: false

wandb_project: Einstein
wandb_entity:
wandb_watch:
wandb_name:
wandb_log_model:
hub_model_id: Weyaxi/Einstein-v4-7B

save_safetensors: true

gradient_accumulation_steps: 4
micro_batch_size: 1
num_epochs: 1.5
optimizer: adamw_bnb_8bit
lr_scheduler: cosine
learning_rate: 0.000005

train_on_inputs: false
group_by_length: false
bf16: true
fp16: false
tf32: false

gradient_checkpointing: true
early_stopping_patience:
resume_from_checkpoint:
local_rank:
logging_steps: 1
xformers_attention:
flash_attention: true

warmup_steps: 10
evals_per_epoch: 2 # changed
eval_table_size:
eval_table_max_new_tokens: 128
saves_per_epoch: 4
debug:

deepspeed: zero3_bf16.json
weight_decay: 0.0
fsdp:
fsdp_config:
special_tokens:
  bos_token: "<s>"
  eos_token: "<|im_end|>"
  unk_token: "<unk>"
tokens:
  - "<|im_start|>"

resume_from_checkpoint: Einstein-v4-model/checkpoint-521