BenchmarkEngineering-F2-7B-slerp開源大語言模型

首頁

Benchmarkengineering F2 7B Slerp

由weezywitasneezy開發

BenchmarkEngineering-F2-7B-slerp是通過融合BenchmarkEngineering-7B-slerp和WestLake-7B-v2模型而創建的7B參數大語言模型，旨在提升原始模型的性能表現。

大型語言模型

Transformers

#多任務基準優化 #模型融合增強 #推理性能提升

下載量 19

發布時間 : 4/8/2024

模型概述

該模型是通過slerp方法融合的兩個7B參數模型的成果，專注於提升在各類基準測試中的表現，特別是在Winogrande任務上有所改進。

模型特點

模型融合技術

使用slerp方法融合兩個高性能7B參數模型，平衡各自優勢

基準測試優化

特別針對Winogrande等基準測試進行了性能優化

高效推理

7B參數規模在保持性能的同時提供相對高效的推理能力

模型能力

文本生成

問答系統

語言理解

推理任務

使用案例

教育與研究

基準測試研究

用於比較不同模型融合方法在標準測試集上的表現

在Winogrande測試中獲得86.11的準確率

開發工具

模型融合實驗平臺

作為研究模型融合技術的實驗平臺

🚀 BenchmarkEngineering-F2-7B-slerp

本模型合併旨在通過整合 Westlake-7B-v2 模型，進一步改進原始的 BenchmarkEngineering 模型。它提升了 Winogrande 測試的得分，但在其他基準測試中有所犧牲。

BenchmarkEngineering-F2-7B-slerp 是使用 LazyMergekit 對以下模型進行合併得到的：

🚀 快速開始

本部分將為你介紹 BenchmarkEngineering-F2-7B-slerp 模型的基本信息和使用方法。

✨ 主要特性

整合 Westlake-7B-v2 模型，對原始的 BenchmarkEngineering 模型進行改進。
在 Winogrande 測試中提升了得分，但在其他基準測試中表現有所不同。

📚 詳細文檔

Open LLM Leaderboard 評估結果

詳細結果可查看此處

指標	值
平均值	75.77
AI2 推理挑戰 (25 次少樣本學習)	73.46
HellaSwag (10 次少樣本學習)	88.88
MMLU (5 次少樣本學習)	64.50
TruthfulQA (0 次少樣本學習)	72.37
Winogrande (5 次少樣本學習)	86.11
GSM8k (5 次少樣本學習)	69.29

🧩 配置

slices:
  - sources:
      - model: weezywitasneezy/BenchmarkEngineering-7B-slerp
        layer_range: [0, 32]
      - model: senseable/WestLake-7B-v2
        layer_range: [0, 32]
merge_method: slerp
base_model: weezywitasneezy/BenchmarkEngineering-7B-slerp
parameters:
  t:
    - filter: self_attn
      value: [0, 0.5, 0.3, 0.7, 1]
    - filter: mlp
      value: [1, 0.5, 0.7, 0.3, 0]
    - value: 0.5
dtype: bfloat16

💻 使用示例

基礎用法

!pip install -qU transformers accelerate

from transformers import AutoTokenizer
import transformers
import torch

model = "weezywitasneezy/BenchmarkEngineering-F2-7B-slerp"
messages = [{"role": "user", "content": "What is a large language model?"}]

tokenizer = AutoTokenizer.from_pretrained(model)
prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
print(outputs[0]["generated_text"])