YamshadowExperiment28-7Bオープンソースモデル - 2024年4月にOpen LLMの7Bパラメータ性能の首位に輝く

ホーム

Yamshadowexperiment28 7B

automergerによって開発

2024年4月8日現在、山影実験28号-7BはOpen LLMランキングで最高性能の7Bパラメータモデルです。使用時には注意が必要で、これはベンチマークへの過剰適合の兆候かもしれません。

大規模言語モデル

Transformers

オープンソースライセンス:Apache-2.0 #7Bパラメータチャンピオン #8k長文コンテキスト #Alpacaテンプレート対応

ダウンロード数 101

リリース時間 : 3/18/2024

モデル概要

このモデルはMaxime LabonneによってYamShadow-7BとExperiment28-7Bを自動融合して作成され、8kコンテキストウィンドウをサポートし、Alpacaチャットテンプレートとの併用が推奨されています。

モデル特徴

高性能7Bモデル

Open LLMランキングで7Bパラメータクラスのトップに位置

長文コンテキスト対応

8k長さのコンテキストウィンドウをサポート

Alpaca互換

Alpacaチャットテンプレートとの併用が推奨され、LM Studioと完全互換

モデル能力

テキスト生成

対話システム

指示追従

使用事例

対話システム

インテリジェントアシスタント

高性能な対話アシスタントの構築

流暢で自然な対話応答を生成可能

テキスト生成

コンテンツ作成

様々なタイプのテキストコンテンツ生成に使用

一貫性があり創造的なテキストを生成可能

🚀 🧪 YamshadowExperiment28-7B

🎉 YamshadowExperiment28-7Bは現在（2024年4月8日）、Open LLM Leaderboardで最も性能の高い7Bモデルです。ただし、ベンチマークに過学習している可能性があるため、注意して使用してください。

YamshadowExperiment28-7Bは、Maxime Labonneによって自動的にマージされたモデルで、以下の設定を使用して作成されています。

image/jpeg

🚀 クイックスタート

このモデルを使用するには、以下の手順に従ってください。

!pip install -qU transformers accelerate

from transformers import AutoTokenizer
import transformers
import torch

model = "automerger/YamshadowExperiment28-7B"
messages = [{"role": "user", "content": "What is a large language model?"}]

tokenizer = AutoTokenizer.from_pretrained(model)
prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
print(outputs[0]["generated_text"])

✨ 主な機能

このモデルは8kのコンテキストウィンドウを使用しています。Alpacaチャットテンプレート（LM Studioで完璧に動作します）と一緒に使用することをおすすめします。
ただし、モデルは時々壊れて、大量の"INST"を出力することがあります。経験上、Open LLM Leaderboardでの優れた結果は、過学習の兆候である可能性が高いです。

💻 使用例

基本的な使用法

!pip install -qU transformers accelerate

from transformers import AutoTokenizer
import transformers
import torch

model = "automerger/YamshadowExperiment28-7B"
messages = [{"role": "user", "content": "What is a large language model?"}]

tokenizer = AutoTokenizer.from_pretrained(model)
prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
print(outputs[0]["generated_text"])

🔧 技術詳細

モデルのマージ設定

slices:
  - sources:
      - model: automerger/YamShadow-7B
        layer_range: [0, 32]
      - model: yam-peleg/Experiment28-7B
        layer_range: [0, 32]
merge_method: slerp
base_model: automerger/YamShadow-7B
parameters:
  t:
    - filter: self_attn
      value: [0, 0.5, 0.3, 0.7, 1]
    - filter: mlp
      value: [1, 0.5, 0.7, 0.3, 0]
    - value: 0.5
dtype: bfloat16
random_seed: 0