StrangeMerges_17-7B-dare_ties開源AI模型 - 融合優勢帶來全新應用體驗

Strangemerges 17 7B Dare Ties

由Gille開發

StrangeMerges_17-7B-dare_ties是通過LazyMergekit合併的兩個模型Gille/StrangeMerges_16-7B-slerp和Gille/StrangeMerges_12-7B-slerp的產物，採用dare_ties合併方法。

大型語言模型

Transformers

開源協議:Apache-2.0 #多任務文本生成 #高精度推理 #DARE-TIES合併

下載量 20

發布時間 : 1/31/2024

模型概述

這是一個7B參數規模的大語言模型，主要用於文本生成任務，在開放LLM排行榜上表現良好。

模型特點

模型合併技術

使用dare_ties方法合併兩個模型，優化了參數密度和權重分配

高效性能

在開放LLM排行榜上平均得分69.54，表現優異

靈活應用

支持多種文本生成任務，可根據需求調整生成參數

模型能力

文本生成

問答系統

知識推理

使用案例

教育

知識問答

回答各類知識性問題

在AI2推理挑戰中達到66.64的歸一化準確率

研究

語言模型研究

用於研究模型合併技術和性能表現

🚀 StrangeMerges_17-7B-dare_ties

StrangeMerges_17-7B-dare_ties是一個通過合併多個模型得到的模型。它藉助LazyMergekit工具，將不同模型的優勢融合，為文本生成任務提供了更強大的能力。

🚀 快速開始

安裝依賴

!pip install -qU transformers accelerate

代碼示例

from transformers import AutoTokenizer
import transformers
import torch

model = "Gille/StrangeMerges_17-7B-dare_ties"
messages = [{"role": "user", "content": "What is a large language model?"}]

tokenizer = AutoTokenizer.from_pretrained(model)
prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
print(outputs[0]["generated_text"])

✨ 主要特性

StrangeMerges_17-7B-dare_ties模型通過合併以下兩個模型構建而成：

📦 安裝指南

使用前需要安裝transformers和accelerate庫，可以使用以下命令進行安裝：

!pip install -qU transformers accelerate

💻 使用示例

基礎用法

from transformers import AutoTokenizer
import transformers
import torch

model = "Gille/StrangeMerges_17-7B-dare_ties"
messages = [{"role": "user", "content": "What is a large language model?"}]

tokenizer = AutoTokenizer.from_pretrained(model)
prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
print(outputs[0]["generated_text"])

📚 詳細文檔

🧩 配置信息

models:
  - model: Gille/StrangeMerges_16-7B-slerp
    # no parameters necessary for base model
  - model: Gille/StrangeMerges_16-7B-slerp
    parameters:
      density: 0.5
      weight: 0.4
  - model: Gille/StrangeMerges_12-7B-slerp
    parameters:
      density: 0.5
      weight: 0.6
merge_method: dare_ties
base_model: Gille/StrangeMerges_16-7B-slerp
parameters:
  normalize: true
dtype: float16

Open LLM Leaderboard評估結果

詳細結果可查看此處

指標	值
平均值	69.54
AI2推理挑戰 (25次少樣本學習)	66.64
HellaSwag (10次少樣本學習)	86.04
MMLU (5次少樣本學習)	65.07
TruthfulQA (0次少樣本學習)	53.18
Winogrande (5次少樣本學習)	81.93
GSM8k (5次少樣本學習)	64.37